JVM 系列 (三) - JVM 对象探秘

本贴最后更新于 2034 天前,其中的信息可能已经事过境迁

原文地址:https://mp.weixin.qq.com/s/tYDkUTPtz3QoMRTpBOPV-w

前言

对于 JVM 运行时区域有了一定了解以后,本文将更进一步介绍虚拟机内存中的数据的细节信息。以 JVM 虚拟机( Hotspot)的内存区域 Java 堆为例,探讨 Java 堆是如何创建对象、如何布局对象以及如何访问对象的。

正文

(一) 对象的创建

说到对象的创建,首先让我们看看 Java 中提供的几种对象创建方式:

Header 解释
使用 new 关键字 调用了构造函数
使用 Class 的 newInstance 方法 调用了构造函数
使用 Constructor 类的 newInstance 方法 调用了构造函数
使用 clone 方法 没有调用构造函数
使用反序列化 没有调用构造函数

下面举例说明五种方式的具体操作方式:

Employee.java

  1. public class Employee implements Cloneable, Serializable {

  2. private static final long serialVersionUID = 1L;

  3. private String name;

  4. public Employee() {}

  5. public Employee(String name) {

  6. this.name = name;

  7. }

  8. public String getName() {

  9. return name;

  10. }

  11. public void setName(String name) {

  12. this.name = name;

  13. }

  14. @Override

  15. public int hashCode() {

  16. final int prime = 31;

  17. int result = 1;

  18. result = prime * result + ((name == null) ? 0 : name.hashCode());

  19. return result;

  20. }

  21. @Override

  22. public boolean equals(Object obj) {

  23. if (this == obj)

  24. return true;

  25. if (obj == null)

  26. return false;

  27. if (getClass() != obj.getClass())

  28. return false;

  29. Employee other = (Employee) obj;

  30. if (name == null) {

  31. if (other.name != null)

  32. return false;

  33. } else if (!name.equals(other.name))

  34. return false;

  35. return true;

  36. }

  37. @Override

  38. public String toString() {

  39. return "Employee [name=" + name + "]";

  40. }

  41. @Override

  42. public Object clone() {

  43. Object obj = null;

  44. try {

  45. obj = super.clone();

  46. } catch (CloneNotSupportedException e) {

  47. e.printStackTrace();

  48. }

  49. return obj;

  50. }

  51. }

1. new 关键字

这是最常见也是最简单的创建对象的方式了。通过这种方式,我们可以调用任意的构造函数(无参的和带参数的)。

  1. Employee emp1 = new Employee();

  2. Employee emp2 = new Employee(name);

2. Class 类的 newInstance 方法

我们也可以使用 Class 类的 newInstance 方法创建对象。这个 newInstance 方法调用无参的构造函数创建对象。

  • 方式一
  1. Employee emp2 = (Employee) Class.forName("org.ostenant.jvm.instance.Employee").newInstance();
  • 方式二
  1. Employee emp2 = Employee.class.newInstance();

3. Constructor 类的 newInstance 方法

Class 类的 newInstance 方法很像, java.lang.reflect.Constructor 类里也有一个 newInstance 方法可以创建对象。我们可以通过这个 newInstance 方法调用有参数的和私有构造函数。其中, Constructor 可以从对应的 Class 类中获得。

  1. Constructor<Employee> constructor = Employee.class.getConstructor();

  2. Employee emp3 = constructor.newInstance();

这两种 newInstance 方法就是大家所说的反射。事实上 Class 的 newInstance 方法内部调用 Constructor 的 newInstance 方法。

4. Clone 方法

无论何时我们调用一个对象的 clone 方法, JVM 都会创建一个新的对象,将前面对象的内容全部拷贝进去。用 clone 方法创建对象并不会调用任何构造函数。

为了使用 clone 方法,我们需要先实现 Cloneable 接口并实现其定义的 clone 方法。

  1. Employee emp4 = (Employee) emp3.clone();

5. 反序列化

当我们序列化反序列化一个对象, JVM 会给我们创建一个单独的对象。在反序列化时, JVM 创建对象并不会调用任何构造函数。

为了反序列化一个对象,我们需要让我们的类实现 Serializable 接口。

  1. ByteArrayOutputStream out = new ByteArrayOutputStream();

  2. ObjectOutputStream oos = new ObjectOutputStream(out);

  3. oos.writeObject(emp4);

  4. ByteArrayInputStream in = new ByteArrayInputStream(oos.toByteArray());

  5. ObjectInputStream ois =new ObjectInputStream(in);

  6. Employee emp5 = (Employee) in.readObject();

本文以 new 关键字为例,讲述 JVM 堆中对象实例的创建过程如下:

  1. 当虚拟机遇到一条 new 指令时,首先会检查这个指令的参数能否在常量池中定位一个符号引用。然后检查这个符号引用的类字节码对象是否加载、解析和初始化。如果没有,将执行对应的类加载过程。

  2. 类加载 完成以后,虚拟机将会为新生对象分配内存区域,对象所需内存空间大小在类加载完成后就已确定。

  3. 内存分配 完成以后,虚拟机将分配到的内存空间都初始化为零值

  4. 虚拟机对对象进行一系列的设置,如所属类的元信息对象的哈希码对象 GC 分带年龄线程持有的锁偏向线程 ID 等信息。这些信息存储在对象头 ( ObjectHeader)。

上述工作完成以后,从虚拟机的角度来说,一个新的对象已经产生了。然而,从 Java 程序的角度来说,对象创建才刚开始。

(二) 对象的布局

HotSpot 虚拟机中,对象在内存中存储的布局可以分为三块区域:对象头Header)、实例数据InstanceData)和对齐填充Padding)。

对象头

HotSpot 虚拟机中,对象头有两部分信息组成:运行时数据类型指针

1. 运行时数据 用于存储对象自身运行时的数据,如哈希码(hashCode)、GC 分带年龄线程持有的锁偏向线程 ID 等信息。

这部分数据的长度在 32 位和 64 位的虚拟机(暂不考虑开启压缩指针的场景)中分别为 32 个和 64Bit,官方称它为 “MarkWord”

在 32 位的 HotSpot 虚拟机中对象未被锁定的状态下,Mark Word 的 32 个 Bit 空间中的 25Bit 用于存储对象哈希码(HashCode),4Bit 用于存储对象分代年龄,2Bits 用于存储锁标志位,1Bit 固定为 0。

在其他状态(轻量级锁定、重量级锁定、GC 标记、可偏向)下对象的存储内容如下表所示:

存储内容 标志位 状态
对象哈希码、对象分代年龄 01 未锁定
指向锁记录的指针 00 轻量级锁定
指向重量级锁的指针 10 膨胀(重量级锁定)
空,不需要记录信息 11 GC 标记
偏向线程 ID、偏向时间戳、对象分代年龄 01 可偏向

2. 类型指针 指向实例对象的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

如果对象是一个 Java 数组,那在对象头中还必须有一块用于记录数组长度的数据。

实例数据

实例数据 部分是对象真正存储的有效信息,无论是从父类继承下来的还是该类自身的,都需要记录下来,而这部分的存储顺序受虚拟机的分配策略定义的顺序的影响。

默认分配策略:

long/double -> int/float -> short/char -> byte/boolean -> reference

如果设置了 -XX:FieldsAllocationStyle=0(默认是 1),那么引用类型数据就会优先分配存储空间:

reference -> long/double -> int/float -> short/char -> byte/boolean

结论:

分配策略总是按照字节大小由大到小的顺序排列,相同字节大小的放在一起。

对齐填充

HotSpot 虚拟机要求每个对象的起始地址必须是 8 字节的整数倍,也就是对象的大小必须是 8 字节的整数倍。而对象头部分正好是 8 字节的倍数( 32 位为 1 倍, 64 位为 2 倍),因此,当对象实例数据部分没有对齐的时候,就需要通过对齐填充来补全。

(三) 对象的访问定位

Java 程序需要通过 JVM 栈上的引用访问堆中的具体对象。对象的访问方式取决于 JVM 虚拟机的实现。目前主流的访问方式有 句柄直接指针 两种方式。

指针: 指向对象,代表一个对象在内存中的起始地址。句柄: 可以理解为指向指针的指针,维护着对象的指针。句柄不直接指向对象,而是指向对象的指针(句柄不发生变化,指向固定内存地址),再由对象的指针指向对象的真实内存地址。

1. 句柄

Java 堆中划分出一块内存来作为句柄池,引用中存储对象的句柄地址,而句柄中包含了对象实例数据对象类型数据各自的具体地址信息,具体构造如下图所示:

优势:引用中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中实例数据指针,而引用本身不需要修改。

2. 直接指针

如果使用直接指针访问,引用 中存储的直接就是对象地址,那么 Java 堆对象内部的布局中就必须考虑如何放置访问类型数据的相关信息。

优势:速度更,节省了一次指针定位的时间开销。由于对象的访问在 Java 中非常频繁,因此这类开销积少成多后也是非常可观的执行成本。

参考

周志明,深入理解 Java 虚拟机:JVM 高级特性与最佳实践,机械工业出版社

  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...