Java 内存模型及其原理

本贴最后更新于 1152 天前,其中的信息可能已经水流花落

概述

在《"Java 并发知识梳理"》这篇文章中曾说道:在并发领域由于可见性问题原子性问题有序性问题,从而会导致并发场景下,结果的不确定性,为了解决可见性有序性导致的问题,Java 构建出了一套内存模型。因而本文就主要谈一谈 Java 内存模型的设计思路以及其原理。

从三个问题说起

缓存导致可见性问题

什么是可见性呢?

一个线程对共享变量的修改,另外一个线程能够立刻看到,我们称为 可见性

在单核时代,所有线程共用同一个 CPU,CPU 的缓存和主存一致性问题非常容易解决。例如下图:

image.png

由于两个线程操作的都是同一个 CPU 的缓存,因而线程 A 如果对变量 V 进行了修改,对线程 B 来说马上就可以知晓,因而不存在 可见性 的问题。

但进入多核时代后,不同线程使用的可能是不同的 CPU 缓存,此时多个 CPU 缓存和主存之间的一致性问题就没有那么容易解决。例如下图:

image.png

线程 A 操作的是 CPU-1 上的缓存,而线程 B 操作的是 CPU-2 上的缓存,很明显,这个时候线程 A 对变量 V 的操作在没有同步到主存的情况下对变量 B 一定是不可见的。

我们以一段代码为例:

public class Test {
  private static long count = 0;
  private void add10K() {
    int idx = 0;
    while(idx++ < 10000) {
      count += 1;
    }
  }
  public static long calc() throws InterruptedException {
    final Test test = new Test();
    // 创建两个线程,执行add()操作
    Thread th1 = new Thread(()->{
      test.add10K();
    });
    Thread th2 = new Thread(()->{
      test.add10K();
    });
    // 启动两个线程
    th1.start();
    th2.start();
    // 等待两个线程执行结束
    th1.join();
    th2.join();
    return count;
  }
  
  public static void main(String[] args) throws InterruptedException {
	System.out.println(calc());
  }
}

直觉告诉我们应该是 20000,因为在单线程里调用两次 add10K() 方法,count 的值就是 20000,但实际上 calc() 的执行结果是个 10000 到 20000 之间的随机数。我在本地测试了若干次结果如下:

第一次执行结果:10190
第二次执行结果:12223
第三册执行结果:10607

造成这样结果的原因是什么呢?

假设线程 1(th1)和线程 2(th2)同时启动,当第一次执行 cout += 1 操作时,可能会出现下边这种情况:

image.png

在 th1 将 count 值读入自己 CPU-1 的缓存中,此时 count 值为 0,此时 th2 也进行了读 count 值的操作,毫无疑问,此时 count 的值为 0;而后 th1 进行了加 1 操作,count 值变为 1,此时由于该操作是在 CPU-1 的缓存中进行,因而对与 th2 来说该操作是不可见的,因而 th2 在执行加 1 操作时,获取的 count 值仍然是 0,进行加法操作后,count 值为 1,接下来 th1 进行缓存和主存同步将 count 值改为 1,而后 th2 进行缓存和主存同步将 count 值再次改为 1。从而造成进行了两次 count += 1 操作,count 的值仅仅增加 1 异常情况发生。

然而想这样加 1 操作,我们共有 10000 次,因而难免会有若干次前面异常执行结果,最终就会造成最终的结果值是位于 10000 到 20000 之间的随机数。

那怎么解决上边的问题呢?

造成上述结果的原因主要就是缓存和主存的不一致造成的,那最暴力的方法当然可以通过禁用缓存来解决,如果没有缓存那该问题自然就迎刃而解,具体来说可以使用 volatile 变量来修饰 count 变量,具体实现和原理可以参考我的另一篇博客《"volatile 的原理及应用"》

当然上述方法比较暴力,而且效率较低,后续会介绍一些其他方案,来高效的解决该问题。

线程切换带来的原子性问题

由于 IO 速度远远小于 CPU 处理速度,因而为了提高 CPU 的利用率,引入了多进程技术,使得即便是单核环境下也可以一边听歌,一边上网。

而单核情况下的多进程技术,本质上是通过时间片轮转来实现的,也就是说先允许一个线程运行一个时间片的时间(比如 50 毫秒),然后切换另一个进程运行一个时间片的时间,循环往复,其示意图如下所示:

image.png

同样的,多线程本质上也是通过时间片轮转技术来实现的,因而也涉及到任务切换。而任务切换大多数情况下,是在时间片结束的时候发生,但 Java 语言某一行语句的执行时间可能不止一个时间片,比如前边所提到的 count += 1 这条指令,就必须要三个 CPU 指令来完成:

  1. 指令 1(第一个时间片):首先,需要把变量 count 从内存加载到 CPU 的寄存器;
  2. 指令 2(第二个时间片):在缓存中将 count 做加 1 操作
  3. 指令 2(第三个时间片):将 count 的值同步到主存中

操作系统做任务切换,可以发生在任何一条 CPU 指令执行完,是的,是 CPU 指令,而不是高级语言里的一条语句。对于上面的三条指令来说,我们假设 count=0,如果线程 A 在指令 1 执行完后做线程切换,线程 A 和线程 B 按照下图的序列执行,那么我们会发现两个线程都执行了 count+=1 的操作,但是得到的结果不是我们期望的 2,而是 1。

image.png

我们潜意识里面觉得 count+=1 这个操作是一个不可分割的整体,就像一个原子一样,但实际上它是由三条指令组成,因而并非是原子操作,基于以上原因,我们在编写多线程程序时可能会出现错误。

编译优化带来的有序性问题

我们知道,在计算机中,CPU 都是通过指令流的形式来执行指令的,为了提高指令流水的执行效率,在编译阶段,编译器会对指令进行重排(指令重调度)(在不影响执行结果的情况下将 不相关 的两个指令放在一起)。但这样也会造成一个问题,代码执行的顺序可能并不会按照代码编写时的先后顺序来执行。某些情况下,顺序的调整可能并不会影响最后的执行结果比如:

a = 1;
b = 2;

调整后:

b = 2;
a = 1;

但在某些情况下,这种调整可能是致命的,会成为 BUG 的来源。

下边我们以双重检测锁实现单例设计模式为例,来说是说有序性可能会导致的问题,具体代码如下所示:

public class Singleton {
  static Singleton instance;
  static Singleton getInstance(){
    if (instance == null) {
      synchronized(Singleton.class) {
        if (instance == null)
          instance = new Singleton();
        }
    }
    return instance;
  }
}

假设有两个线程 A、B 同时调用 getInstance() 方法,他们会同时发现 instance == null,于是同时对 Singleton.class 加锁,此时 JVM 保证只有一个线程能够加锁成功(假设是线程 A),另外一个线程则会处于等待状态(假设是线程 B);线程 A 会创建一个 Singleton 实例,之后释放锁,锁释放后,线程 B 被唤醒,线程 B 再次尝试加锁,此时是可以加锁成功的,加锁成功后,线程 B 检查 instance == null 时会发现,已经创建过 Singleton 实例了,所以线程 B 不会再创建一个 Singleton 实例。

整个过程,看上去似乎很完美,但实际上这个 getInstance()方法是存在问题的。问题在呢?主要是在 new 操作上,我们想当然的认为 new 操作应该是这个样子的:

  1. 分配一块空间 M
  2. 然后在 M 上初始化 Singleton()对象
  3. 将 M 地址赋值给 instance 变量

但实际的优化路径确实这样的:

  1. 分配一块内存 M;
  2. 将 M 的地址赋值给 instance 变量;
  3. 最后在内存 M 上初始化 Singleton 对象。

但这样(优化后)就会带了一个问题:

我们假设第一个线程先执行 getInstance() 方法,首先对 instance 进行判断此时明显为空,而后进行 instance 对象的初始化操作,分配空间 M、将 M 的地址赋值给变量 instance。如果此时进行线程切换线程 2 开始对 instance 进行判断,instance 已经被赋了 M 的地址,因而此时为非空的,会直接返回 instance,但由于 instance 并未被初始化,此时访问 instance 的成员变量就可能触发空指针异常。整个过程流程图,如下图所示:

image.png

同样的要解决该问题也可以通过禁用指令重排来实现,具体可以参考《"volatile 的原理及应用"》

内存模型

正如前面所说,由于缓存导致了可见性的问题,由于编译优化带来了有序性的问题,而解决这两个问题的最有效方案就是禁用缓存和编译优化。 这样虽然说解决了问题,但随之带来的是效率和性能的降低,因而最合理的方案应该是按需禁用缓存和编译优化。

那么,如何做到“按需禁用”呢?对于并发程序,何时禁用缓存以及编译优化只有程序员知道,那所谓“按需禁用”其实就是指按照程序员的要求来禁用。所以,为了解决可见性和有序性问题,只需要提供给程序员按需禁用缓存和编译优化的方法即可。

Java 内存模型是一个比较复杂的概念,从不同的角度看,它有不同的内容:

从内存功能划分角度看,它由主内存和工作内存的组成以及内存间的交互操作两部分构成。从程序员编程角度看,Java 内存模型规范了 JVM 如何提供按需禁用缓存和编译优化的方法。具体来说,这些方法包括 volatile、synchronized 和 final 三个关键字,以及六项 Happens-Before 规则。

- 内存模型 - 内存划分角度 - 主内存与工作内存的划分 - 内存间的交互操作 - 从程序员使用角度 - volatile - synchronized - final - 六项Happens-Before规则

首先我们了解一下 Java 内存模型中主内存和工作内存的划分问题:

主内存和工作内存的划分

首先,我们思考一个问题,为何需要重新定义一种内存模型,而不是用操作系统本身具有的内存模型呢?

问题其实也很好回答,不同操作系统在实现线程时,可能方案不同的,硬件细节可能也是有差异的,而 Java 本身作为跨平台语言,必须有一套统一的内存模型,来屏蔽各种硬件和操作系统的内存访问差异,让 Java 程序在各个平台下都能够达到一致的内存访问效果。

从内存角度来看,Java 内存的主要目的定义程序中各种变量的访问规则,即关注虚拟机中把变量值存储到内存和从内存中去除变量值这样的细节。

具体来说,Java 内存模型规定了所有的变量都存储在 主内存(Main Memory)中(此处的主内存跟介绍物理硬件时提到的主内存的名字是一样的,两者也可以类比,但从物理层面看,它属于虚拟机内存的一部分)。每条线程都有自己的 工作内存(Working Memory)。线程中的工作内存保存了该线程使用的变量的主内存副本,线程对变量的所有操作都必须在工作内存中进行,而不能直接读写主内存中的数据。不同线程之间也无法直接访问对方工作内存中的变量,不同线程变量值的传递都是通过主内存来完成。线程、主内存和工作内存三者之间的关系如下图所示:

image.png

在明白了工作内存和主内存的关系之后,接下来我们需要搞清楚的是工作内存和主内存之间的一个同步的问题即内存之间的交互操作

内存间的交互操作

关于主内存和工作内存之间的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存这一类的实现细节,Java 内存模型定义了 8 种操作来完成。Java 虚拟机在实现这 8 中操作时会保证每一种操作都是原子的、不可拆分的

  • lock(锁定):作用于主内存变量,把一个变量标识为线程独占的状态。
  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
  • read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便后续 load 动作使用
  • load(载入):作用于工作内存的变量,把 read 操作从主内存中得到的变量值放到工作内存的变量副本中
  • use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个使用变量的值的指令时将执行这个操作。
  • assign(赋值):作用于工作内存的变量,它把一个执行引擎接受的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
  • store(存储):作用于工作内存,它把工作内存中一个变量的值传送到主内存中,便于随后 write 操作使用。
  • write(写入):作用于主内存的变量,它把 store 操作从工作内存中得到的变量的值放到主内存的变量中。

如果要把一个变量从内存中拷贝到工作内存中则需要顺序的执行 readload 操作,如果要把变量从工作内存中同步回主内存,则需要按顺序执行 storewrite 操作。但需要注意的是上边的操作 Java 虚拟机要求必须是顺序的,但并不要求是连续的。 也就是说 read 之后的下一个操作必须是 load,但它们之间可以存在一定的间隔时间。

为了保证操作正确性,针对上边的八种操作,定义了如果规则:

比如:

  • 不允许 read 和 load、sotre 和 write 操作单独出现,即不允许一个变量从主内存中读取了但工作内存不接受,或者工作内存发起回写,但主内存不接受的情况发生。
  • 不允许一个线程丢弃它最近的 assign 操作,即变量在工作内存中改变了之后必须把该变化的同步回主内存。
  • 不允许一个线程无原因的把数据同步回工作内存。
  • ........

规则一共有 8 条,比较复杂感兴趣可以参考周志华老师的《深入理解 JVM 虚拟机》第三版,443 页上边的详细描述,此处不再详述。

因为上边的整个定义是比较琐碎的,就开发者来说是没法直接使用的,它更多面向的是虚拟机开发人员来看,因而就程序员使用而言,我们更加关注的点是三个关键字和六项 Happen-Before 规则。

三个关键字

volatile

volatile 是 Java 虚拟机提供的最轻量级的同步机制,当一个变量被定义为 volatile 之后,它将具有两个特性:

第一项是保证此变量对所有线程的可见性,这里的看见行是指一个线程修改了这个变量的值,新值对其他线程来说是立即可知的。而普通变量并不能做到这一点,普通变量的值在线程传递时均需要通过主内存来完成。比如,线程 A 修改了一个普通变量的值,然后向主内存中进行回写,另一条线程 B 在线程 A 回写完成之后再对主内存进行读取操作,新变量值才会对线程 B 可见。

另一项作用禁止指令重排序优化,普通的变量仅会保证在该方法的执行过程中所有依赖赋值的结果的地方都能获取到正确的结果,而不能保证变量赋值操作的顺序与程序代码的执行顺序一致。

关于 volatile 的具体使用和原理可以参考另一篇博客《"volatile 的原理及应用" 》

synchronized

Java 语言提供的 synchronized 关键字,就是锁的一种实现。synchronized 关键字可以用来修饰方法,也可以用来修饰代码块,通过对代码加上 synchronized 修饰,可以保证其原子操作解决原子性问题。

关于其具体原理可以参考:《"synchronized 的原理及应用"》

final

final 关键字就比较简单,final 修饰变量时,初衷是告诉编译器:这个变量生而不变,可以可劲儿优化。

因而被 final 修饰的关键字是绝对线程安全,不会有线程安全的问题。

Happen-Before 规则

如何理解 Happens-Before 呢?

Happens-Before 并不是说前面一个操作发生在后续操作的前面,它真正要表达的是:前面一个操作的结果对后续操作是可见的。就像有心灵感应的两个人,虽然远隔千里,一个人心之所想,另一个人都看得到。Happens-Before 规则就是要保证线程之间的这种“心灵感应”。所以比较正式的说法是:Happens-Before 约束了编译器的优化行为,虽允许编译器优化,但是要求编译器优化后一定遵守 Happens-Before 规则。

Happen-Before 规则主要有六项,主要包含以下内容:

- Happen-Before规则 - 程序的顺序性规则 - volatile 变量规则 - 传递性 - 管程中锁的规则 - 线程 start() 规则 - 线程 join() 规则

1. 程序的顺序性规则

这条规则是指在一个线程中,按照程序顺序,前面的操作 Happens-Before 于后续的任意操作。这个规则比较容易容易理解,我们以下边一个代码为例:

class VolatileExample {
  int x = 0;
  volatile boolean v = false;
  public void writer() {
    x = 42;
    v = true;
  }
  public void reader() {
    if (v == true) {
      // 这里x会是多少呢?
    }
  }
}

第六行代码 x = 42 对于第七行代码 v = true 是可见的。

这也比较符合单线程里面的思维:程序前面对某个变量的修改一定是对后续操作可见的。

2. volatile 变量规则

这条规则是指对一个 volatile 变量的写操作, Happens-Before 于后续对这个 volatile 变量的读操作。这个其实就是有点像禁用缓存的意思,似乎跟 JDK1.5 中的定义没有啥区别,但是和后序传递性相结合的话,就会有不同的含义。

3. 传递性

这条规则是指如果 A Happens-Before B,且 B Happens-Before C,那么 A Happens-Before C。这个就比较容易理解,很像是数学中学习的传递性。

我们将该条规则与规则"1. 程序的顺序性规则"、 规则"2. volatile 变量规则" 结合一下会发生什么呢 ❓ ❓

image.png

从图中,我们可以看到:

  1. 根据规则"1. 程序的顺序性规则",x = 42 Happen-Before 于 写变量 v = true
  2. 由于 x 由 volatile 关键字修饰,根据规则"2. volatile 变量规则",写变量 v = true 先发生于读变量 v == ture
  3. 根据规则"3. 传递性",我们可以推知 x = 42 Happen-Before 于读变量 v==true

而这就意味对于线程 B 执行方法 reader(),运行到 v == true 时,对于 x 的结果一定会是 42。这就是 1.5 版本对 volatile 语义的增强,这个增强意义重大,1.5 版本的并发工具包(java.util.concurrent)就是靠 volatile 语义来搞定可见性的,这个在后面的内容中会详细介绍。

4. 管程中锁的规则

这条规则是指,对一个锁的解锁操作 Happen-Before 于后续对这个变量的加锁操作。

在了解这条规则之前,我们要首先了解一下管程,什么是管程呢?

简单来说管程就是一种同步原语,在 Java 中 synchronized 就是管程的一种实现。

管程的锁在 Java 中是隐式的,例如下边代码,进入代码块时,会自动加锁,出代码块时会自动解锁:

synchronized (this) { //此处自动加锁
  // x是共享变量,初始值=10
  if (this.x < 12) {
    this.x = 12; 
  }  
} //此处自动解锁

结合规则 4,当两个线程 A 和 B 都执行该代码块时,线程 A 进入代码块后,将 x 的值由原来的 10 改成 12,在此过程中 B 如果执行到该代码块时,线程 A 加的锁对线程 B 是可见的,因而线程 B 会先进入阻塞队列,等到线程 A 执行完之后,线程 B 继续执行,因为线程 A 的执行结果对想成 B 可见,因而此时 x 的值已经是 12 了。

5. 线程 start()规则

这条是关于线程启动的。它是指主线程 A 启动子线程 B 后,子线程 B 能够看到主线程在启动子线程 B 前的操作。

也就是说,主线程在启动子线程之前的操作 Happen-Before 于线程 B 中的任意操作。以代码为例:

Thread B = new Thread(()->{
  // 主线程调用B.start()之前
  // 所有对共享变量的修改,此处皆可见
  // 此例中,var==77
});
// 此处对共享变量var修改
var = 77;
// 主线程启动子线程
B.start();

变量 var = 77 在线程 B 的代码主体中都是可见的。

6. 线程 join()规则

这条是关于线程等待的。它是指主线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的 join() 方法实现),当子线程 B 完成后(主线程 A 中 join() 方法返回),主线程能够看到子线程的操作。当然所谓的“看到”,指的是对共享变量的操作。

换句话就是说,如果在线程 A 中,调用线程 B 的 join() 并成功返回,那么线程 B 中的任意操作 Happens-Before 于该 join() 操作的返回。以代码为例:

int var;
Thread B = new Thread(()->{
  // 此处对共享变量var修改
  var = 66;
});
// 例如此处对共享变量修改,
// 则这个修改结果对线程B可见
// 主线程启动子线程
B.start();
B.join()
// 子线程所有对共享变量的修改
// 在主线程调用B.join()之后皆可见
// 此例中,var==66

在主线程执行完 B 的 join() 方法之后,对于变量 var = 66 这一结果均是可见的。

总结

本文主要讲了 Java 内存模型的原理及其构成,Java 内存模型按照不同角度的划分,可以看到不同的内容,从 JVM 设计者的角度看,我们可以看到"主内存和工作内存的划分"以及"内存间的交互操作"。从程序员角度看,我们能够看到三个常用的关键字:volatile、synchronized 以及 final,并且简单介绍了这个三个关键字的作用,后续也会分别写出对应详细的文章,从原理角度进行阐述 volatile 和 synchronized 的原理以及使用。同时,对于 Happens-Before 规则我们也有详细的介绍,分成了六部分就行了详细的阐述。

参考

  1. 《深入理解 JVM 虚拟机》
  2. 《Java 并发变成实战》
  3. 《Java 并发编程实战》
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3169 引用 • 8208 回帖
  • 并发
    75 引用 • 73 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...