关于int和Integer不得不说的事

关于int和Integer不得不说的事

一月 14, 2020

任何一个学过 Java 的人,肯定知道 int 是原始数据类型,Integer 是一个对象,他们之间可以自动地拆箱装箱。但,如果继续挖掘,仍然大有分析地余地。你,真的懂 int 和 Integer 了吗?

我们先来看一段代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public static void main(String[] args) {
    Integer i = 10;
    Integer j = 10;
    System.out.println(i == j);
      
    Integer a = 128;
    Integer b = 128;
    System.out.println(a == b);
     
    int k = 10;
    System.out.println(k == i);
    int kk = 128;
    System.out.println(kk == a);
      
    Integer m = new Integer(10);
    Integer n = new Integer(10);
    System.out.println(m == n);
}
运行结果
true
false
true
true
false

①、第一个打印结果为 true

  对于 i == j ,我们知道这是两个Integer类,他们比较应该是用equals,这里用==比较的是地址,那么结果肯定为false,但是实际上结果为true,这是为什么?

  我们进入到Integer 类的valueOf()方法:

  分析源码我们可以知道在 i >= -128 并且 i <= 127 的时候,第一次声明会将 i 的值放入缓存中,第二次直接取缓存里面的数据,而不是重新创建一个Ingeter 对象。那么第一个打印结果因为 i = 10 在缓存表示范围内,所以为 true。

  ②、第二个打印结果为 false

  从上面的分析我们知道,128是不在-128到127之间的,所以第一次创建对象的时候没有缓存,第二次创建了一个新的Integer对象。故打印结果为false

  ③、第三个打印结果为 true

  Integer 的自动拆箱功能,也就是比较两个基本数据类型,结果当然为true

  ④、第四个打印结果为 true

  解释和第三个一样。int和integer(无论new否)比,都为true,因为会把Integer自动拆箱为int再去比较。

  ⑤、第五个打印结果为 false

  因为这个虽然值为10,但是我们都是通过 new 关键字来创建的两个对象,是不存在缓存的概念的。两个用new关键字创建的对象用 == 进行比较,结果当然为 false。

关于自动拆箱和装箱

我们都知道 int 和 Integer 可以自动相互转换,这是 Java 给我们提供的一种语法糖,但是,它是“怎么”转换的?在什么时候转换?是编译期还是运行期?
简单来讲:自动装箱就是Integer.valueOf(int i);自动拆箱就是 i.intValue();
眼见为实,让我们编写一段代码来实际看看过程

1
2
3
4
5
6
7
public class TestClass {

public void inc () {
Integer integer = 1;
int unboxing = integer ++;
}
}

这是一段普通的代码,但它完整包含了三个动作:将一个原始数据类型转换成包装类型、将一个包装类型转换成一个原始数据类型、对一个包装类型进行直接的运算。

接下来通过 javap -verbose 指令解析编译后的 class 文件,以下是在我的电脑上的 JDK 1.8 版本解析的结果,看看编译过程发生了什么事

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
public void inc();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=2, locals=5, args_size=1
0: iconst_1
1: invokestatic #2 // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
4: astore_1
5: aload_1
6: astore_3
7: aload_1
8: invokevirtual #3 // Method java/lang/Integer.intValue:()I
11: iconst_1
12: iadd
13: invokestatic #2 // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
16: dup
17: astore_1
18: astore 4
20: aload_3
21: invokevirtual #3 // Method java/lang/Integer.intValue:()I
24: istore_2
25: return

这是节选自 inc() 方法的一段字节码,查看它的操作指令及注释,可以得出结论

  • 自动拆箱装箱是在编译期完成的
  • javac 将装箱操作用Integer.valueOf()代替了,将拆箱用Integer.intValue()代替了
  • 包装对象的运算,要先拆箱成原始数据类型,进行运算完毕后再装箱

通过对这个反编译例子的研究,我们就明白,在以后编程中,需要进行大量计算的地方,应该使用原始数据类型,在性能敏感的场合,优先使用原始数据类型。

关于 Integer 源码

整体看一下 Integer 类的源码,可以发现这个类主要是由几个常量,两个装箱拆箱方法,一些进制转换方法,一些位操作方法组成。
其中有几个比较有意思的点,

类和常量都被 final 修饰了起来。

很容易由此联想到这是一个不可变类 (immutable),由此想到不可变类的设计原则:

  • 类标识打上 final 标志
  • 类变量使用 final 修饰
  • 提供构造或者工厂方法设置类变量的初始值,不提供set方法
  • 构造时,对引用类型使用深拷贝,避免外部不确定因素的影响
  • 将集合改为不可变集合,比如使用 Java 9List.of()方法

特别的常量

Integer 类除了提供最大、最小的常数外,还提供了位数和字节数的两个常量。后面这两个常量,值得提一下。

如果我们写过 c 或者 c++ 语言,就会知道,在这两种语言中, int 类型在 32 位和 64 位系统中是不确定的。而在 Java 中,我们无需担忧这种不同,因为在 Java 语言规范中明确规定了各种基本类型的长度。

https://docs.oracle.com/javase/specs/jls/se10/html/jls-4.html#jls-4.2
这也是 Java 实现它的承诺——一次书写,到处运行,的一个细节。

关于缓存

我们都知道 Java 自动缓存了一个小范围的整数值。并且都在无数的地方中看到了别人对这个范围的描述—— -128~127。但,如果读过了 Integer 的源码,你就会发现这是错误的说法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
static final int low = -128;
static final int high;
static final Integer cache[];

static {
// high value may be configured by property
int h = 127;
String integerCacheHighPropValue =
sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
if (integerCacheHighPropValue != null) {
try {
int i = parseInt(integerCacheHighPropValue);
i = Math.max(i, 127);
// Maximum array size is Integer.MAX_VALUE
h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
} catch( NumberFormatException nfe) {
// If the property cannot be parsed into an int, ignore it.
}
}
high = h;

cache = new Integer[(high - low) + 1];
int j = low;
for(int k = 0; k < cache.length; k++)
cache[k] = new Integer(j++);

// range [-128, 127] must be interned (JLS7 5.1.7)
assert IntegerCache.high >= 127;
}

在生成缓存的这段代码中,我们注意到了一个细节,范围的下限确实是 -128,但上限是可以调节的。
如果我们的程序需要更大的缓存范围,我们可以通过在启动 JVM 时增加参数-XX:AutoBoxCacheMax=N,来设置这个缓存范围的上限。

对于缓存,还可以同样观察下其他基本类型的包装类,都同样做了一个小范围的缓存。

关于占用空间

如果我们要创建 10 万个整数,那么光是对象头的占用空间,Integer 就要比 int 多出一个数量级。这是对象机制不可避免带来的问题,我们在编写操作大量数据的代码时,也应该考虑占用空间的问题。

关于线程安全

我们都知道,不可变类是实现线程安全共享对象的一种方式。但是原始元素类型的运算就不是线程安全的。如果多个线程同时对一个 int 对象做运算,就可能引发并发问题。

如果有线程安全计算的需要,可以使用 AtomicInteger 这样的线程安全类进行计算。

但,如果不想涉及到类,想直接在原始数据类型上做并发操作,也是有办法的。Java 提供了 AtomicIntegerFieldUpdater 这样的类进行 cas 安全操作。下面是使用原始数据类型实现一个计数器的方式。

1
2
3
4
5
6
7
 class CompactCounter {
private volatile long counter;
private static final AtomicLongFieldUpdater<CompactCounter> updater = AtomicLongFieldUpdater.newUpdater(CompactCounter.class, "counter");
public void increase() {
updater.incrementAndGet(this);
}
}

关于局限性

Java 走过了这么多年的历程,这种类型系统的设计已经是很久前的了,现在也逐渐暴露了一些缺点。

  • 原始数据类型不能和泛型完美配合。
    Java 的泛型机制,是一种伪泛型,它在编译期将类型转换为特定的类型。这就要求相应类型可以转换为 Object。
  • 无法高效地表达数据
    如果我们写过 python、scala。就会知道,这些语言中有 vector、tuple。极大地方便了我们编程,简洁了代码。
    但是由于 Java 语言的实现机制,在对象数组中存放的是对象的引用,实际对象分散在堆内存的各个地方。这种方式虽然带来了极大的灵活性,但是却带来了数据操作的低效