JVM 系列 (三) - JVM 对象探秘

原文地址：https://mp.weixin.qq.com/s/tYDkUTPtz3QoMRTpBOPV-w

前言

对于 JVM 运行时区域有了一定了解以后，本文将更进一步介绍虚拟机内存中的数据的细节信息。以 JVM 虚拟机( Hotspot)的内存区域 Java 堆为例，探讨 Java 堆是如何创建对象、如何布局对象以及如何访问对象的。

正文

(一) 对象的创建

说到对象的创建，首先让我们看看 Java 中提供的几种对象创建方式：

Header	解释
使用 new 关键字	调用了构造函数
使用 Class 的 newInstance 方法	调用了构造函数
使用 Constructor 类的 newInstance 方法	调用了构造函数
使用 clone 方法	没有调用构造函数
使用反序列化	没有调用构造函数

下面举例说明五种方式的具体操作方式：

Employee.java

public class Employee implements Cloneable, Serializable {
private static final long serialVersionUID = 1L;
private String name;
public Employee() {}
public Employee(String name) {
this.name = name;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
@Override
public int hashCode() {
final int prime = 31;
int result = 1;
result = prime * result + ((name == null) ? 0 : name.hashCode());
return result;
}
@Override
public boolean equals(Object obj) {
if (this == obj)
return true;
if (obj == null)
return false;
if (getClass() != obj.getClass())
return false;
Employee other = (Employee) obj;
if (name == null) {
if (other.name != null)
return false;
} else if (!name.equals(other.name))
return false;
return true;
}
@Override
public String toString() {
return "Employee [name=" + name + "]";
}
@Override
public Object clone() {
Object obj = null;
try {
obj = super.clone();
} catch (CloneNotSupportedException e) {
e.printStackTrace();
}
return obj;
}
}

1. new 关键字

这是最常见也是最简单的创建对象的方式了。通过这种方式，我们可以调用任意的构造函数(无参的和带参数的)。

Employee emp1 = new Employee();
Employee emp2 = new Employee(name);

2. Class 类的 newInstance 方法

我们也可以使用 Class 类的 newInstance 方法创建对象。这个 newInstance 方法调用无参的构造函数创建对象。

方式一

Employee emp2 = (Employee) Class.forName("org.ostenant.jvm.instance.Employee").newInstance();

方式二

Employee emp2 = Employee.class.newInstance();

3. Constructor 类的 newInstance 方法

和 Class 类的 newInstance 方法很像， java.lang.reflect.Constructor 类里也有一个 newInstance 方法可以创建对象。我们可以通过这个 newInstance 方法调用有参数的和私有的构造函数。其中， Constructor 可以从对应的 Class 类中获得。

Constructor<Employee> constructor = Employee.class.getConstructor();
Employee emp3 = constructor.newInstance();

这两种 newInstance 方法就是大家所说的反射。事实上 Class 的 newInstance 方法内部调用 Constructor 的 newInstance 方法。

4. Clone 方法

无论何时我们调用一个对象的 clone 方法， JVM 都会创建一个新的对象，将前面对象的内容全部拷贝进去。用 clone 方法创建对象并不会调用任何构造函数。

为了使用 clone 方法，我们需要先实现 Cloneable 接口并实现其定义的 clone 方法。

Employee emp4 = (Employee) emp3.clone();

5. 反序列化

当我们序列化和反序列化一个对象， JVM 会给我们创建一个单独的对象。在反序列化时， JVM 创建对象并不会调用任何构造函数。

为了反序列化一个对象，我们需要让我们的类实现 Serializable 接口。

ByteArrayOutputStream out = new ByteArrayOutputStream();
ObjectOutputStream oos = new ObjectOutputStream(out);
oos.writeObject(emp4);
ByteArrayInputStream in = new ByteArrayInputStream(oos.toByteArray());
ObjectInputStream ois =new ObjectInputStream(in);
Employee emp5 = (Employee) in.readObject();

本文以 new 关键字为例，讲述 JVM 堆中对象实例的创建过程如下：

当虚拟机遇到一条 new 指令时，首先会检查这个指令的参数能否在常量池中定位一个符号引用。然后检查这个符号引用的类字节码对象是否加载、解析和初始化。如果没有，将执行对应的类加载过程。
类加载 完成以后，虚拟机将会为新生对象分配内存区域，对象所需内存空间大小在类加载完成后就已确定。
内存分配 完成以后，虚拟机将分配到的内存空间都初始化为零值。
虚拟机对对象进行一系列的设置，如所属类的元信息、对象的哈希码、对象 GC 分带年龄、线程持有的锁 、偏向线程 ID 等信息。这些信息存储在对象头 ( ObjectHeader)。

上述工作完成以后，从虚拟机的角度来说，一个新的对象已经产生了。然而，从 Java 程序的角度来说，对象创建才刚开始。

(二) 对象的布局

HotSpot 虚拟机中，对象在内存中存储的布局可以分为三块区域：对象头（ Header）、实例数据（ InstanceData）和对齐填充（ Padding）。

对象头

在 HotSpot 虚拟机中，对象头有两部分信息组成：运行时数据 和 类型指针。

1. 运行时数据 用于存储对象自身运行时的数据，如哈希码（hashCode）、GC 分带年龄、线程持有的锁、偏向线程 ID 等信息。

这部分数据的长度在 32 位和 64 位的虚拟机（暂不考虑开启压缩指针的场景）中分别为 32 个和 64 个 Bit，官方称它为 “MarkWord”。

在 32 位的 HotSpot 虚拟机中对象未被锁定的状态下，Mark Word 的 32 个 Bit 空间中的 25Bit 用于存储对象哈希码（HashCode），4Bit 用于存储对象分代年龄，2Bits 用于存储锁标志位，1Bit 固定为 0。

在其他状态（轻量级锁定、重量级锁定、GC 标记、可偏向）下对象的存储内容如下表所示：

存储内容	标志位	状态
对象哈希码、对象分代年龄	01	未锁定
指向锁记录的指针	00	轻量级锁定
指向重量级锁的指针	10	膨胀（重量级锁定）
空，不需要记录信息	11	GC 标记
偏向线程 ID、偏向时间戳、对象分代年龄	01	可偏向

2. 类型指针 指向实例对象的类元数据的指针，虚拟机通过这个指针来确定这个对象是哪个类的实例。

如果对象是一个 Java 数组，那在对象头中还必须有一块用于记录数组长度的数据。

实例数据

实例数据 部分是对象真正存储的有效信息，无论是从父类继承下来的还是该类自身的，都需要记录下来，而这部分的存储顺序受虚拟机的分配策略和定义的顺序的影响。

默认分配策略：

long/double -> int/float -> short/char -> byte/boolean -> reference

如果设置了 -XX:FieldsAllocationStyle=0（默认是 1），那么引用类型数据就会优先分配存储空间：

reference -> long/double -> int/float -> short/char -> byte/boolean

结论：

分配策略总是按照字节大小由大到小的顺序排列，相同字节大小的放在一起。

对齐填充

HotSpot 虚拟机要求每个对象的起始地址必须是 8 字节的整数倍，也就是对象的大小必须是 8 字节的整数倍。而对象头部分正好是 8 字节的倍数（ 32 位为 1 倍， 64 位为 2 倍），因此，当对象实例数据部分没有对齐的时候，就需要通过对齐填充来补全。

(三) 对象的访问定位

Java 程序需要通过 JVM 栈上的引用访问堆中的具体对象。对象的访问方式取决于 JVM 虚拟机的实现。目前主流的访问方式有句柄和 直接指针 两种方式。

指针： 指向对象，代表一个对象在内存中的起始地址。句柄： 可以理解为指向指针的指针，维护着对象的指针。句柄不直接指向对象，而是指向对象的指针（句柄不发生变化，指向固定内存地址），再由对象的指针指向对象的真实内存地址。

1. 句柄

Java 堆中划分出一块内存来作为句柄池，引用中存储对象的句柄地址，而句柄中包含了对象实例数据与对象类型数据各自的具体地址信息，具体构造如下图所示：

优势：引用中存储的是稳定的句柄地址，在对象被移动（垃圾收集时移动对象是非常普遍的行为）时只会改变句柄中的实例数据指针，而引用本身不需要修改。

2. 直接指针

如果使用直接指针访问，引用中存储的直接就是对象地址，那么 Java 堆对象内部的布局中就必须考虑如何放置访问类型数据的相关信息。

优势：速度更快，节省了一次指针定位的时间开销。由于对象的访问在 Java 中非常频繁，因此这类开销积少成多后也是非常可观的执行成本。

参考

周志明，深入理解 Java 虚拟机：JVM 高级特性与最佳实践，机械工业出版社

JVM 系列 (三) - JVM 对象探秘

前言

正文

(一) 对象的创建

1. new 关键字

2. Class 类的 newInstance 方法

3. Constructor 类的 newInstance 方法

4. Clone 方法

5. 反序列化

(二) 对象的布局

对象头

实例数据

对齐填充

(三) 对象的访问定位

1. 句柄

2. 直接指针

参考

相关帖子

jvm 内存区域

字节码文件结构

Java 的 System 类中 out 对象是何时被赋值的

虚拟机篇

jvm-demo 系列一：解析命令行工具类

常用的 Java 性能测试工具实战

Pytorch JIT 扩展自定义算子

欢迎来到这里！