Java 虚拟机

本贴最后更新于 2607 天前,其中的信息可能已经水流花落

1、前言
作为一名 Java 程序开发,几乎每天都在和虚拟机打交道,今天就说说我对于虚拟机的理解。
我们平常接触到的虚拟机有 jvm 、dvm 、art 虚拟机。 dvm 是基于 jvm 优化而用于移动端,art 针对 dvm 又进行了优化。 本质都是 jvm 优化版,所以本章以讲解 jvm 为主。

2、class 文件(jvm 的执行文件)

什么是 class 文件?
能被 jvm 识别、加载并执行的文件格式,是一种 8 位字节的二进制流文件,它记录了一个类文件的所有信息并远远多于 java 源文件的内容(如 this、super 等这些在 class 文件中都会被编译器赋值)

如何生成 class 文件?
编码生成.java 文件 通过 jdk 的 javac 命令生成 .java -> .class , 每个 java 类或接口都会编译生成一个对应的 class 文件(也因为此当虚拟机查找类文件中的内容时会有大量的 io 操作),

编译流程:
1ce24747dda84760a218c05d3d4a6d96.png
这里我们只做了解即可,编译原理已经忘的差不多了,很尴尬。

缺点?
每个类文件记录了大量的信息,占用内存较大(class 的文件结构可以通过二进制阅读软件去查看,有兴趣可以去详细了解其结构);
基于堆栈的加载模式,加载速度慢;
文件 io 操作多,类查找慢。
因此它并不适合移动端,由此产生了 dvm、art 这类移动端的虚拟机

3、jvm 的结构
a744cacf4f6a42e2834eee73dd16e4ec.png

class 文件由类加载器载入内存,加载时会先对 class 文件进行校验、解析等操作,如图:
27a6ab35b84148d0ae83503f3c52ceb6.png

4、内存管理
内存空间分为: 栈区、方法区、本地方法栈区、堆区
Java 栈区:
存放 Java 方法执行时的所有数据,由栈帧组成
Java 栈帧:
包含:局部变量表、栈操作数、动态链接、方法出口
每个方法从调用到执行完成对应了一个栈帧在虚拟机栈中的入栈和出栈,当超过栈所允许的最大深度时就会抛出 stackoverflow 异常(比如方法中死循环)
本地方法栈:
专门为 native 方法服务的栈区
方法区:
存放加载的类信息、常量、静态变量、即时编译器编译后的数据
该区会一直占用内存
堆区:
所有创建的对象都存放于该区,是虚拟机中最大的一块内存,也是 GC 要回收的部分

在堆区内存中又划分了几块: 新生代区(young generation)、老生代区(old generation)、永久区(permanent generation)

456c80f6c034441382562ab093e3a809.png

新生代区: 存放新生成的对象
老生代区: 当新生代区内存不足时,根据算法将新生代的某些对象移入该区,为新生代区提供内存存放新对象,当新生代区和老生代区都无可用内存时就会出现 OOM

为什么要在堆区区分新生代区和老生代区?有什么好处?
如此区分,可以允许开发者去动态调整新生代区和老生代区的大小,便于内存分配以适应不同场景,
如一些大型服务类场景 并不需要频繁创建对象 就可以让老生代内存大一些 方便这些服务常驻 提高服务稳定性
如即时通讯 临时消息对象多 就可以把新生代调整的大一些 老生带小一些 加快内存分配

5、内存垃圾回收 (GC)
虚拟机要去回收垃圾,首先得知道哪些对象是垃圾对象,然后才能去回收。这里就涉及到垃圾收集算法和垃圾回收算法

垃圾收集算法

1、引用计数算法
这是 jvm 早期使用的算法,jdk1.2 之前所用
创建对象时会为其产生引用计数器并加 1,都有新引用引用该对象时计数器 +1,引用该对象的引用销毁时计数器-1,当为 0 时即为垃圾对象,可以被回收
缺陷: 两个对象相互引用时(环形引用),计数器都为 1,但是两者都不可达,却导致无法回收
f65d424937b84b25a8c99518ae4031db.png
代码举例:
A a = new A();
B b = new B();
a.b = b;
b.a = a;
a = null;
b = null;
这个时候 a,b 引用被置空,但其 ab 两个对象还在堆中且相互引用,我们也没法通过引用找到这两个对象,他们也无法被回收。

2、可达性算法 (根搜索算法)

jdk1.2 之后对垃圾收集算法进行了改进

将所有引用关系视作一张图

从 GcRoot 节点开始寻找对应的所有引用的节点,找到节点后继续寻找它的引用节点,当所有引用节点寻找完毕后,没有被引用的节点不可达节点,就是垃圾对象,这样也解决了环引用对象回收问题
86f17dcdcbba434c82d4ce218bc64a6b.png

说到引用,这里简单说一下,引用有几种类型:
强引用 Object obj = new Object(); 不回收

软引用 内存不足时回收

弱引用 WeakReference wf = new WeakReference(obj); gc 时回收

虚引用 gc 时回收

垃圾回收算法

通过垃圾收集算法找到了要回收的垃圾如何进行回收呢?

1、标记-清除算法

将未被引用的对象(不可达对象)标记为可回收对象,垃圾回收时将其清除
a2d6159d876348458e4a4c1763d5dd3f.png
优点: 不需要对对象进行移动,仅对不存活的对象进行处理,在存活对象多时会极为高效
缺点: 直接清除对象置空,容易造成内存碎片,不利于后续内存分配

2、复制算法
将可达对象复制到空闲内存中,不可达的直接跳过,最后将原来的内存清空
b84aab34e6214e3a8018fffedb51800f.png
优势:存活对象少时高效
缺点:需要更多内存作交换空间 (需要内存大)

3、标记-整理算法
清除不可达对象后,将后续可达对象移动到该清除后的内存区域并更新引用的位置
d9d7d937c7c2499e89a842bafc99c1d8.png
在标记-清除算法的基础上进行了移动,成本更高,但解决了内存碎片问题

总结:
这三种算法各有优劣,在虚拟机中会动态根据情况采用不同的算法,而不是只用一种算法

6、垃圾回收的触发
1、jvm 无法再为新对象分配内存空间时触发

2、手动调用 System.gc() (不推荐使用) 不会立马去执行垃圾回收,会加大虚拟机压力

3、低优先级的 GC 线程被启动时会触发

看到这里,相信对 jvm 已经有了比较深的了解了,下面再将 jvm 、dvm、art 进行对比
7、jvm、dvm、art 之间的比较
** jvm 与 dvm**

1、执行文件格式不同,class / dex(将多个.class 文件通过命令一个生成 dex 文件)

2、dvm 类加载系统与 jvm 区别较大

3、dvm 可以同时存在多个(某一个挂掉的话不会影响其他 dvm 的运行,确保稳定性),jvm 只能同时存在 1 个

4、dalvik 基于寄存器的,jvm 基于栈,寄存器被内存更快。

ART

dvm 使用 JIT 动态将字节码转换成机器码效率低。 (JIT : Just In Time ,每次运行时转码)

ART 采用了 AOT(ahead of time 安装时就进行转码)预编译技术,执行速度快

ART 会占用更多应用安装时间和存储空间(空间换时间)

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3169 引用 • 8208 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    131 引用 • 1114 回帖 • 136 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 445 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    84 引用 • 139 回帖 • 2 关注
  • 倾城之链
    23 引用 • 66 回帖 • 125 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 26 关注
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖 • 4 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    10 引用 • 88 回帖
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    54 引用 • 85 回帖
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖 • 1 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    52 引用 • 37 回帖 • 2 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 387 关注
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    52 引用 • 190 回帖 • 1 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 721 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 48 关注
  • 电影

    这是一个不能说的秘密。

    120 引用 • 598 回帖
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 698 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 562 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 619 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖 • 1 关注
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 1 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    28 引用 • 108 回帖
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    324 引用 • 1395 回帖
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 148 关注
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    5 引用 • 62 回帖 • 8 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    58 引用 • 113 回帖 • 273 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 460 关注