Java 虚拟机

本贴最后更新于 2817 天前,其中的信息可能已经水流花落

1、前言
作为一名 Java 程序开发,几乎每天都在和虚拟机打交道,今天就说说我对于虚拟机的理解。
我们平常接触到的虚拟机有 jvm 、dvm 、art 虚拟机。 dvm 是基于 jvm 优化而用于移动端,art 针对 dvm 又进行了优化。 本质都是 jvm 优化版,所以本章以讲解 jvm 为主。

2、class 文件(jvm 的执行文件)

什么是 class 文件?
能被 jvm 识别、加载并执行的文件格式,是一种 8 位字节的二进制流文件,它记录了一个类文件的所有信息并远远多于 java 源文件的内容(如 this、super 等这些在 class 文件中都会被编译器赋值)

如何生成 class 文件?
编码生成.java 文件 通过 jdk 的 javac 命令生成 .java -> .class , 每个 java 类或接口都会编译生成一个对应的 class 文件(也因为此当虚拟机查找类文件中的内容时会有大量的 io 操作),

编译流程:
1ce24747dda84760a218c05d3d4a6d96.png
这里我们只做了解即可,编译原理已经忘的差不多了,很尴尬。

缺点?
每个类文件记录了大量的信息,占用内存较大(class 的文件结构可以通过二进制阅读软件去查看,有兴趣可以去详细了解其结构);
基于堆栈的加载模式,加载速度慢;
文件 io 操作多,类查找慢。
因此它并不适合移动端,由此产生了 dvm、art 这类移动端的虚拟机

3、jvm 的结构
a744cacf4f6a42e2834eee73dd16e4ec.png

class 文件由类加载器载入内存,加载时会先对 class 文件进行校验、解析等操作,如图:
27a6ab35b84148d0ae83503f3c52ceb6.png

4、内存管理
内存空间分为: 栈区、方法区、本地方法栈区、堆区
Java 栈区:
存放 Java 方法执行时的所有数据,由栈帧组成
Java 栈帧:
包含:局部变量表、栈操作数、动态链接、方法出口
每个方法从调用到执行完成对应了一个栈帧在虚拟机栈中的入栈和出栈,当超过栈所允许的最大深度时就会抛出 stackoverflow 异常(比如方法中死循环)
本地方法栈:
专门为 native 方法服务的栈区
方法区:
存放加载的类信息、常量、静态变量、即时编译器编译后的数据
该区会一直占用内存
堆区:
所有创建的对象都存放于该区,是虚拟机中最大的一块内存,也是 GC 要回收的部分

在堆区内存中又划分了几块: 新生代区(young generation)、老生代区(old generation)、永久区(permanent generation)

456c80f6c034441382562ab093e3a809.png

新生代区: 存放新生成的对象
老生代区: 当新生代区内存不足时,根据算法将新生代的某些对象移入该区,为新生代区提供内存存放新对象,当新生代区和老生代区都无可用内存时就会出现 OOM

为什么要在堆区区分新生代区和老生代区?有什么好处?
如此区分,可以允许开发者去动态调整新生代区和老生代区的大小,便于内存分配以适应不同场景,
如一些大型服务类场景 并不需要频繁创建对象 就可以让老生代内存大一些 方便这些服务常驻 提高服务稳定性
如即时通讯 临时消息对象多 就可以把新生代调整的大一些 老生带小一些 加快内存分配

5、内存垃圾回收 (GC)
虚拟机要去回收垃圾,首先得知道哪些对象是垃圾对象,然后才能去回收。这里就涉及到垃圾收集算法和垃圾回收算法

垃圾收集算法

1、引用计数算法
这是 jvm 早期使用的算法,jdk1.2 之前所用
创建对象时会为其产生引用计数器并加 1,都有新引用引用该对象时计数器 +1,引用该对象的引用销毁时计数器-1,当为 0 时即为垃圾对象,可以被回收
缺陷: 两个对象相互引用时(环形引用),计数器都为 1,但是两者都不可达,却导致无法回收
f65d424937b84b25a8c99518ae4031db.png
代码举例:
A a = new A();
B b = new B();
a.b = b;
b.a = a;
a = null;
b = null;
这个时候 a,b 引用被置空,但其 ab 两个对象还在堆中且相互引用,我们也没法通过引用找到这两个对象,他们也无法被回收。

2、可达性算法 (根搜索算法)

jdk1.2 之后对垃圾收集算法进行了改进

将所有引用关系视作一张图

从 GcRoot 节点开始寻找对应的所有引用的节点,找到节点后继续寻找它的引用节点,当所有引用节点寻找完毕后,没有被引用的节点不可达节点,就是垃圾对象,这样也解决了环引用对象回收问题
86f17dcdcbba434c82d4ce218bc64a6b.png

说到引用,这里简单说一下,引用有几种类型:
强引用 Object obj = new Object(); 不回收

软引用 内存不足时回收

弱引用 WeakReference wf = new WeakReference(obj); gc 时回收

虚引用 gc 时回收

垃圾回收算法

通过垃圾收集算法找到了要回收的垃圾如何进行回收呢?

1、标记-清除算法

将未被引用的对象(不可达对象)标记为可回收对象,垃圾回收时将其清除
a2d6159d876348458e4a4c1763d5dd3f.png
优点: 不需要对对象进行移动,仅对不存活的对象进行处理,在存活对象多时会极为高效
缺点: 直接清除对象置空,容易造成内存碎片,不利于后续内存分配

2、复制算法
将可达对象复制到空闲内存中,不可达的直接跳过,最后将原来的内存清空
b84aab34e6214e3a8018fffedb51800f.png
优势:存活对象少时高效
缺点:需要更多内存作交换空间 (需要内存大)

3、标记-整理算法
清除不可达对象后,将后续可达对象移动到该清除后的内存区域并更新引用的位置
d9d7d937c7c2499e89a842bafc99c1d8.png
在标记-清除算法的基础上进行了移动,成本更高,但解决了内存碎片问题

总结:
这三种算法各有优劣,在虚拟机中会动态根据情况采用不同的算法,而不是只用一种算法

6、垃圾回收的触发
1、jvm 无法再为新对象分配内存空间时触发

2、手动调用 System.gc() (不推荐使用) 不会立马去执行垃圾回收,会加大虚拟机压力

3、低优先级的 GC 线程被启动时会触发

看到这里,相信对 jvm 已经有了比较深的了解了,下面再将 jvm 、dvm、art 进行对比
7、jvm、dvm、art 之间的比较
** jvm 与 dvm**

1、执行文件格式不同,class / dex(将多个.class 文件通过命令一个生成 dex 文件)

2、dvm 类加载系统与 jvm 区别较大

3、dvm 可以同时存在多个(某一个挂掉的话不会影响其他 dvm 的运行,确保稳定性),jvm 只能同时存在 1 个

4、dalvik 基于寄存器的,jvm 基于栈,寄存器被内存更快。

ART

dvm 使用 JIT 动态将字节码转换成机器码效率低。 (JIT : Just In Time ,每次运行时转码)

ART 采用了 AOT(ahead of time 安装时就进行转码)预编译技术,执行速度快

ART 会占用更多应用安装时间和存储空间(空间换时间)

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3194 引用 • 8214 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    21 引用 • 245 回帖 • 235 关注
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    36 引用 • 37 回帖 • 544 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    28 引用 • 197 回帖 • 28 关注
  • 电影

    这是一个不能说的秘密。

    122 引用 • 608 回帖
  • sts
    2 引用 • 2 回帖 • 224 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    56 引用 • 85 回帖
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    12 引用 • 54 回帖 • 168 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖 • 3 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    556 引用 • 674 回帖
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 664 关注
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 381 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 2 关注
  • OneDrive
    2 引用 • 4 关注
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    200 引用 • 120 回帖
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖 • 2 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    295 引用 • 750 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 84 关注
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    132 引用 • 796 回帖
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    366 引用 • 1842 回帖 • 2 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 147 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    425 引用 • 1250 回帖 • 599 关注
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    239 引用 • 224 回帖
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 28 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    325 引用 • 1395 回帖
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    24695 引用 • 101365 回帖