GC 知识点
主要分三个部分:
- 如何判断该对象要回收(是垃圾)
- 回收的算法有哪些?
- 垃圾收集器
判断一个对象是否可以回收
1. 引用计数法
Python 采用该种算法,但是解决了相互引用的问题
为对象添加一个引用计数器,当对象增加一个引用时计数器加 1,引用失效时计数器减 1。引用计数为 0 的对象可被回收。
在两个对象出现循环引用的情况下,此时引用计数器永远不为 0,导致无法对它们进行回收。正是因为循环引用的存在,因此 Java 虚拟机不使用引用计数算法。
2. GC root(可达性算法)
从 GCroot 出发遍历,标记每个可访达的对象为活动对象,遍历不到的对象(Obj4)就会被接下来要讲的几种算法回收了。
GC root 可以是以下几种:
- Java 方法栈桢中的局部变量;
- 已加载类的静态变量;
- JNI handles;
- 已启动且未停止的 Java 线程。
多线程环境下,会产生误报和漏报。
误报:A 线程修改了访问,B 线程会导致垃圾也被标记了,不会被清除,造成内存浪费。
漏报:将仍被应用的对象标记为垃圾。
误报和漏报的理解:误报大不了不回收嘛,漏报比较严重。垃圾回收是先标记活的对象,后回收死的对象,那么如果标记好后,其它线程产生了垃圾,即将活的变死了,这种内存是不会释放的。另外,如果这时产生了新对象,由于没被标记为活的,所以被释放了,这就危险了。
Q:如何解决?(实际 JVM 虚拟机并不会出现这种情况)
A:Stop-the-world 以及安全点(安全词),垃圾回收线程工作时,其他非垃圾回收线程一律等待!
垃圾回收算法
1.标记 - 清除算法
利用 GC root 遍历到的标记(非垃圾),那么其余的就是垃圾了,直接把剩下的对象标记为空闲内存。
- 优点:标记和清除的过程效率不高
- 缺点:产生大量不连续碎片,就无法给大内存的对象分配空间了
2.标记 - 整理算法(压缩算法)
即把存活的对象聚集到内存区域的起始位置,从而留下一段连续的内存空间。
- 优点:结果是很美好的,拥有了连续的内存空间,所以一般老年代使用该种算法,因为老年代的频率明显比新生代低很多。
- 缺点:性能拉胯,毕竟要移动。(让我想到了为么 MySQL 用 b+ 树,而不用有序数组,因为数据量大的时候插入、删除、移动的效率太低下了)
3.复制算法
将内存划分为大小相等的两块(Java8 的中 S0、S1),每次只使用其中一块,当这一块内存用完了就将还存活的对象复制到另一块上面,然后再把使用过的内存空间进行一次清理。(有点像数组的 System.arraycopy,利用 from 和 to 两个指针)。
所以所谓的 S0 和 S1 是相互复制然后全标记的,都会成为「空」的空间和复制来的对象的空间。
主要的不足是每次 S0 和 S1 肯定有一块是空的,为了接下来的复制,所以也算是小浪费。
HotSpot 虚拟机的 Eden 和 Survivor 大小比例默认为 8:1,保证了内存的利用率达到 90%。如果每次回收有多于 10% 的对象存活,那么一块 Survivor 就不够用了,此时需要依赖于老年代进行空间分配担保,也就是借用老年代的空间存储放不下的对象。
4.分代收集算法
现在的商业虚拟机采用分代收集算法,它根据对象存活周期将内存划分为几块,不同块采用适当的收集算法。
一般将堆分为新生代和老年代。
- 新生代使用:复制算法
- 老年代使用:标记 - 清除 或者 标记 - 整理 算法
5.总结
先 Minor GC(Young GC),再 Major GC(Full GC)。S0/S1 交换 14 次后晋升至老年代(Java8 之后是元空间,位于本地内存),jvm 默认值是 15。
一般来说 OOM 是内存耗尽,也有超大内存(不多)的情况。
以上是我画的图,其中少了一步,当新生代晋升至老年代的时候失败怎么办?其实这里是执行 Major GC,也就是走下面的那条流程。
垃圾收集器
可以简单理解成新生代搞一个收集器,老年代搞一个收集器,Java8 默认的就是 Parallel + Parallel Old 收集器
- 串行回收:Serial GC
- 并行回收:Parallel GC:吞吐量高(因为并行,花费 GC 的时间少,所以可以让出时间给其他非 GC 线程),适用于科学计算。
- 并发回收:CMS(ConcMarkSweep,并发标记清除):其实有 STW,也有并行。后备方案是 Serial Old。而且是标记清除,会有碎片,会导致提前 Major GC;吞吐量低,但是适用是高并发、快速响应的场景。
- Java9 之后的:G1,Java11 之后的:ZGC(在 G1 基础上),使命就是为了替换 CMS。
JVM 调优配了新生代,老年代会跟着配对应的垃圾收集器。
除了以上 4 种,主要还有以下 3 种:
- Serial Old(已废弃)
- ParNew
- ParOld
参数 | 新生代 | 新生代算法 | 老年代(元空间) | 老年代算法 |
---|---|---|---|---|
-xx:+UseSerialGC | Serial | 复制 | Serial old | 标记整理 |
-xx:+UseParNewGC | ParNew | 复制 | Serial old | 标记整理 |
-xx:+UseParallelGC | Parallel | 复制 | Parallel old | 标记整理 |
-xx:+UseConcMarkSweepGC | ParNew | 复制 | CMS / Serial old | 标记清除 |
-xx:+UseG1GC | G1 | 不区别新老年代 | 整体是标记整理 | 局部是复制算法 |
G1 和 CMS 的区别:
- G1 分块设计,会移动不同的内存对象。G1 虽然是标记清除算法,但是不会产生碎片
- G1 可以设置 STW 的时间,假如设置太小,就会频繁 GC,降低吞吐量
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于