Java 虚拟机

本贴最后更新于 2960 天前,其中的信息可能已经水流花落

1、前言
作为一名 Java 程序开发,几乎每天都在和虚拟机打交道,今天就说说我对于虚拟机的理解。
我们平常接触到的虚拟机有 jvm 、dvm 、art 虚拟机。 dvm 是基于 jvm 优化而用于移动端,art 针对 dvm 又进行了优化。 本质都是 jvm 优化版,所以本章以讲解 jvm 为主。

2、class 文件(jvm 的执行文件)

什么是 class 文件?
能被 jvm 识别、加载并执行的文件格式,是一种 8 位字节的二进制流文件,它记录了一个类文件的所有信息并远远多于 java 源文件的内容(如 this、super 等这些在 class 文件中都会被编译器赋值)

如何生成 class 文件?
编码生成.java 文件 通过 jdk 的 javac 命令生成 .java -> .class , 每个 java 类或接口都会编译生成一个对应的 class 文件(也因为此当虚拟机查找类文件中的内容时会有大量的 io 操作),

编译流程:
1ce24747dda84760a218c05d3d4a6d96.png
这里我们只做了解即可,编译原理已经忘的差不多了,很尴尬。

缺点?
每个类文件记录了大量的信息,占用内存较大(class 的文件结构可以通过二进制阅读软件去查看,有兴趣可以去详细了解其结构);
基于堆栈的加载模式,加载速度慢;
文件 io 操作多,类查找慢。
因此它并不适合移动端,由此产生了 dvm、art 这类移动端的虚拟机

3、jvm 的结构
a744cacf4f6a42e2834eee73dd16e4ec.png

class 文件由类加载器载入内存,加载时会先对 class 文件进行校验、解析等操作,如图:
27a6ab35b84148d0ae83503f3c52ceb6.png

4、内存管理
内存空间分为: 栈区、方法区、本地方法栈区、堆区
Java 栈区:
存放 Java 方法执行时的所有数据,由栈帧组成
Java 栈帧:
包含:局部变量表、栈操作数、动态链接、方法出口
每个方法从调用到执行完成对应了一个栈帧在虚拟机栈中的入栈和出栈,当超过栈所允许的最大深度时就会抛出 stackoverflow 异常(比如方法中死循环)
本地方法栈:
专门为 native 方法服务的栈区
方法区:
存放加载的类信息、常量、静态变量、即时编译器编译后的数据
该区会一直占用内存
堆区:
所有创建的对象都存放于该区,是虚拟机中最大的一块内存,也是 GC 要回收的部分

在堆区内存中又划分了几块: 新生代区(young generation)、老生代区(old generation)、永久区(permanent generation)

456c80f6c034441382562ab093e3a809.png

新生代区: 存放新生成的对象
老生代区: 当新生代区内存不足时,根据算法将新生代的某些对象移入该区,为新生代区提供内存存放新对象,当新生代区和老生代区都无可用内存时就会出现 OOM

为什么要在堆区区分新生代区和老生代区?有什么好处?
如此区分,可以允许开发者去动态调整新生代区和老生代区的大小,便于内存分配以适应不同场景,
如一些大型服务类场景 并不需要频繁创建对象 就可以让老生代内存大一些 方便这些服务常驻 提高服务稳定性
如即时通讯 临时消息对象多 就可以把新生代调整的大一些 老生带小一些 加快内存分配

5、内存垃圾回收 (GC)
虚拟机要去回收垃圾,首先得知道哪些对象是垃圾对象,然后才能去回收。这里就涉及到垃圾收集算法和垃圾回收算法

垃圾收集算法

1、引用计数算法
这是 jvm 早期使用的算法,jdk1.2 之前所用
创建对象时会为其产生引用计数器并加 1,都有新引用引用该对象时计数器 +1,引用该对象的引用销毁时计数器-1,当为 0 时即为垃圾对象,可以被回收
缺陷: 两个对象相互引用时(环形引用),计数器都为 1,但是两者都不可达,却导致无法回收
f65d424937b84b25a8c99518ae4031db.png
代码举例:
A a = new A();
B b = new B();
a.b = b;
b.a = a;
a = null;
b = null;
这个时候 a,b 引用被置空,但其 ab 两个对象还在堆中且相互引用,我们也没法通过引用找到这两个对象,他们也无法被回收。

2、可达性算法 (根搜索算法)

jdk1.2 之后对垃圾收集算法进行了改进

将所有引用关系视作一张图

从 GcRoot 节点开始寻找对应的所有引用的节点,找到节点后继续寻找它的引用节点,当所有引用节点寻找完毕后,没有被引用的节点不可达节点,就是垃圾对象,这样也解决了环引用对象回收问题
86f17dcdcbba434c82d4ce218bc64a6b.png

说到引用,这里简单说一下,引用有几种类型:
强引用 Object obj = new Object(); 不回收

软引用 内存不足时回收

弱引用 WeakReference wf = new WeakReference(obj); gc 时回收

虚引用 gc 时回收

垃圾回收算法

通过垃圾收集算法找到了要回收的垃圾如何进行回收呢?

1、标记-清除算法

将未被引用的对象(不可达对象)标记为可回收对象,垃圾回收时将其清除
a2d6159d876348458e4a4c1763d5dd3f.png
优点: 不需要对对象进行移动,仅对不存活的对象进行处理,在存活对象多时会极为高效
缺点: 直接清除对象置空,容易造成内存碎片,不利于后续内存分配

2、复制算法
将可达对象复制到空闲内存中,不可达的直接跳过,最后将原来的内存清空
b84aab34e6214e3a8018fffedb51800f.png
优势:存活对象少时高效
缺点:需要更多内存作交换空间 (需要内存大)

3、标记-整理算法
清除不可达对象后,将后续可达对象移动到该清除后的内存区域并更新引用的位置
d9d7d937c7c2499e89a842bafc99c1d8.png
在标记-清除算法的基础上进行了移动,成本更高,但解决了内存碎片问题

总结:
这三种算法各有优劣,在虚拟机中会动态根据情况采用不同的算法,而不是只用一种算法

6、垃圾回收的触发
1、jvm 无法再为新对象分配内存空间时触发

2、手动调用 System.gc() (不推荐使用) 不会立马去执行垃圾回收,会加大虚拟机压力

3、低优先级的 GC 线程被启动时会触发

看到这里,相信对 jvm 已经有了比较深的了解了,下面再将 jvm 、dvm、art 进行对比
7、jvm、dvm、art 之间的比较
** jvm 与 dvm**

1、执行文件格式不同,class / dex(将多个.class 文件通过命令一个生成 dex 文件)

2、dvm 类加载系统与 jvm 区别较大

3、dvm 可以同时存在多个(某一个挂掉的话不会影响其他 dvm 的运行,确保稳定性),jvm 只能同时存在 1 个

4、dalvik 基于寄存器的,jvm 基于栈,寄存器被内存更快。

ART

dvm 使用 JIT 动态将字节码转换成机器码效率低。 (JIT : Just In Time ,每次运行时转码)

ART 采用了 AOT(ahead of time 安装时就进行转码)预编译技术,执行速度快

ART 会占用更多应用安装时间和存储空间(空间换时间)

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3203 引用 • 8217 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    554 引用 • 675 回帖
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    61 引用 • 29 回帖 • 6 关注
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖 • 4 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    89 引用 • 150 回帖
  • Visio
    1 引用 • 2 回帖
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 651 关注
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    34 引用 • 37 回帖 • 555 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 2 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 45 关注
  • OnlyOffice
    4 引用 • 18 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 259 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 26 关注
  • OpenCV
    15 引用 • 36 回帖
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 644 关注
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 56 关注
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 618 关注
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 186 关注
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖
  • Flutter

    Flutter 是谷歌的移动 UI 框架,可以快速在 iOS 和 Android 上构建高质量的原生用户界面。 Flutter 可以与现有的代码一起工作,它正在被越来越多的开发者和组织使用,并且 Flutter 是完全免费、开源的。

    39 引用 • 92 回帖 • 11 关注
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    125 引用 • 74 回帖
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 6 关注
  • Access
    1 引用 • 3 回帖 • 3 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖 • 3 关注
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    86 引用 • 165 回帖 • 1 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 776 关注