JVM的底层实现

参考文献：

JVM 是 Java 实现跨平台的基石。Java 源代码（或者 Groovy、Kotlin 等等）经编译后变成字节码文件 .class，最后在运行时 JVM 会以解释执行 + 即时编译混合的方式运行：解释器可直接执行字节码，JIT 编译器则会将热点代码编译为机器码并缓存，由此实现一次编译，处处运行的特性。同时，JVM 还提供内存管理和垃圾回收能力。

JVM 并非只有一种，不过平时接触到的都是 HotSpot VM。

JVM对源代码的处理过程

而JVM本身可以分成3部分：类加载子系统、运行时数据区和执行引擎。

JVM结构示例图

类加载子系统。负责从其他来源加载 .class 文件，将 .class 文件中的二进制数据读入到内存当中。
运行时数据区。JVM在运行Java程序时，需要从内存中分配空间来处理数据、指令、对象等数据结构。
执行引擎。负责执行字节码，包括即时编译器 JIT 和解释器。
垃圾回收器不属于执行引擎，是独立于执行引擎的内存管理模块。

编译器

JIT 编译器

JVM 中集成了两种编译器：Client Compiler (C1) 和 Server Compiler (C2)。JVM 最初会以解释器的方式逐条执行字节码，当它发现某些代码被频繁执行时，JIT 编译器就会介入，将这部分字节码动态编译成高度优化的本地代码，供 JVM 直接执行。

C1 编译器的启动速度快，但是峰值性能相比 C2 来说会差一点。C1 会做3件事：

局部简单可靠的优化，如在字节码上进行的一些基础优化、方法内敛、常量传播等
将字节码构造成高级中间表示 (High-level Intermediate Representation HIR)，HIR 和平台无关，通常采用图结构，更适合 JVM 对程序进行优化
再将 HIR 转换成低级中间表示 (Low-level Intermediate Representation LIR)，LIR 再经过寄存器分配等处理后，最终生成机器码

在 HotSpot VM 中默认的 Server Compiler 是 C2 编译器。其在进行编译优化时，会使用控制流和数据流结合的图的数据结构，成为 Ideal Graph。该图表示当前程序的数据流向和指令之间的关系。依靠这种图结构，某些优化步骤就能简化了。

C2 编译耗时更长，进行更激进的优化，比如锁的膨胀与消除、逃逸分析等。

从 JDK 9 开始，HotSpot VM 中集成了新的 Server Compiler，Graal 编译器。该编辑器具有以下几种关键特性

Graal 对分支预测、条件优化等支持更完善，峰值性能通常优于 C2.
支持虚函数内联、部分逃逸分析等。

AOT

JDK 9 引入了新的编译模式 AOT (Ahead of Time Compilation)。与 JIT 不同，AOT 会在程序运行前就将其编译成机器码，属于静态编译（像 C 或者 C++ 那样）。AOT 避免了 JIT 预热等各方面的开销，可以提高 Java 程序的启动速度，避免预热时间过长，特别适合云原生、微服务场景。

通过静态编译，程序会被编译成一个和运行时环境强相关的 native image 文件，最后直接执行该文件即可启动程序进行执行，无需传统 JVM 完整运行时。

GraalVM 是目前主流的 Java 静态编译实现方案，它不仅是多语言运行时平台（包含上文提到的 Graal JIT 编译器），其内置的 Native Image 工具（核心为 Substrate VM）还支持将 Java 程序直接编译为本地可执行文件。Substrate VM 通过上下文敏感的指向分析技术，在编译期对程序进行静态分析，构建出所有可达函数 / 类的列表，并以此为基础完成编译。然而，这种静态分析方式存在固有局限，难以自动处理 Java 反射、动态代理、JNI 调用等动态特性，导致大量依赖这些特性的主流 Java 框架无法直接通过 Native Image 编译。为解决这一问题，社区推出了针对性工具：例如 Spring 框架提供的 AOT 引擎，可在编译阶段分析项目中的反射、动态代理等行为，提前生成对应的元数据和初始化代码，确保 Spring 应用能适配 GraalVM Native Image 的静态编译流程。

内存管理

按照Java虚拟机规范，JVM的内存区域可以细分为程序计数器、虚拟机栈、本地方法栈、堆和方法区。其中堆和方法区是线程共享的，前三者是线程私有的。

程序计数器
类似计组的PC寄存器，存放下一条指令的地址。
虚拟机栈
即方法执行时创建的栈帧，栈帧中存储局部变量表、操作数栈、动态链接、方法返回地址等信息。我们平时所说的Java的“栈”就是Java虚拟机栈。

在空方法中，静态方法由于不需要访问实例对象，因此在局部变量表中不会有额外变量。但非静态方法中即使是空方法也会隐式包含一个this引用。该引用指向当前实例对象，在方法调用时由 JVM 隐式传入。
本地方法栈
这个栈与虚拟机栈的不同之处在于，本地方法栈为虚拟机用到的本地native方法服务，如在Java中调用用C/C++等语言编写的底层库方法。常用于需要与操作系统底层或硬件交互的时候。如获取系统时间或Object类中的hashCode()和clone()方法等。

native作为一个关键字来声明方法，表示一个在Java代码中声明，但具体实现是由C或C++来编写，并在JVM外部实现的方法。其实际实现不在.class文件中，而在.dll(Windows)或.so(Linux)中。这个库需要被JVM加载。
Java代码中调用native方法后，JVM接收到这个调用，并通过JNI（Java 本地接口）找到已加载的本地库中对应的C/C++函数。执行完成后将返回值通过JNI返回给JVM。
堆
JVM所管理的最大一块内存区域，也是垃圾收集器管理的主要区域，因此很多时候也被称为GC堆。几乎所有的对象实例以及数组都应当在堆上分配内存。存放在这里的对象数据都是线程不安全的，进行并发操作时需要同步机制。

从 JDK 7 开始，JVM 默认开启了逃逸分析，意味着如果某些方法中的对象引用没有被返回或者没有在方法体外使用，也就是未逃逸出去，那么对象可以直接在栈上分配内存。
方法区
存储已被虚拟机加载的类信息、常量、静态变量、代码缓存等数据。

在JDK 7之前，该区域常被称为“永久代”。但在JDK 8及以后，JVM使用元空间作为方法区的实现。元空间不再使用JVM内存，而是使用本地内存，因此受到本地内存大小的限制。

堆和栈的区别是什么？
堆属于线程共享的内存区域，几乎所有 new 出来的对象都会在堆上分配，在不再被任何变量引用时被垃圾收集器回收。
栈属于线程的私有区域，主要存储局部变量等数据，通常随着方法调用的结束而自动释放，不需要垃圾收集器参与。

对象的生命周期

创建

graph LR
A(new一个对象)
B{类加载检查}
C[类加载]
D[分配内存]
E[对象内存初始化]
F[设置对象头]
G[执行init方法]

A-->B-->D-->E-->F-->G
B-->|否|C-->D

JVM遇到一条new指令时，首先会检查这个指令的参数是否能在运行时常量池中定位到一个类的符号引用，检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有，就必须要先执行对应的类加载过程，这是对象创建的前提。
类加载检查通过后，JVM将为新生对象分配内存。JVM在堆中划分出一块确定大小的内存有两种方式：
1. 指针碰撞，在堆内存规整的情况下，所有用过的内存在一边，空闲的内存在另一边，中间放着一个指针作为分界点的指示器。分配内存就是把这个指针向空闲方向移动合适的距离。
2. 空闲列表，在堆内存不规整的情况下，JVM维护一个记录可用内存块的列表。在分配时，从列表中找出一块足够大的空间划分给对象，并更新列表记录。
这不就是操作系统里的first fit嘛

其线程安全问题主要通过CAS和重试和 TLAB 本地分配缓冲区两种方法解决。

每个线程在Java堆中分配一小块称为 TLAB 的内存空间。线程需要分配对象时，直接从 TLAB 中分配。只有当 TLAB 用完并分配新的 TLAB 时，才需要同步锁定，使用全局分配指针。
如果关闭 TLAB，对象直接在共享堆上分配，会导致同步竞争增加，且 Eden 区占用更快，容易触发频繁 Young GC，甚至让部分对象过早晋升到老年代，间接加剧 Full GC。
JVM将分配到的空间都初始化为零值（0、0.0、false、null等）。
JVM对对象进行必要的设置，这些消息主要放在对象头中。
从JVM的视角看，对象已经产生了。但对于Java程序来说，对象创建才刚刚开始。构造器代码开始执行。编译器将实例变量初始化语句和构造器代码合并后，生成了<init>方法。
1. 递归向上，执行父类的<init>方法，确保父类先初始化
2. 按出现顺序初始化类中的实例变量（如int a = 1这样的语句）
3. 执行构造器中的剩余代码

内存分区转移

Java堆被分为新生代和老年代两个区域。其中，新生代又被划分为一个较大的Eden空间和两个较小的Survivor空间（From Survivor和To Survivor）。

新创建的对象会被分配到Eden空间。当Eden区填满时，会触发一次Minor GC，清除不再使用的对象。存活下来的对象会移动到Survivor区。

详细来说，新创建的对象绝大多数会首先被分配在Eden区。在Minor GC时，Eden区和当前From Survivor区中存活的对象，会被复制到To Survivor中，然后清空Eden和刚使用的Survivor，将To Survivor转变为新的From Survivor，另一个同理。如此Survivor的角色互换。

对象在新生代中经历多次GC后仍然存活的（默认为15次），会被移动到老年代。若Survivor中同年龄对象的总大小超过了 Survivor 容量的一定比例，那么大于等于该年龄的对象也可能提前移动到老年代。老年代内存不足时，会触发Major GC 或 Full GC，对整个堆进行垃圾回收。

而对于大对象的定义，一般由参数-XX:PretenureSizeThreshold控制，但该参数通常不启用。在G1垃圾收集器中，大对象会被直接分配到HUMONGOUS区域。当对象大小超过一个Region容量的一半时，会被认为是一个大对象。

销毁

垃圾收集器通过可达性分析算法判断对象是否可达，若对象不可达则会被回收。

可以通过 java -XX:+PrintCommandLineFlags -version 命令查看 JVM 默认启用的 GC 收集器。通过-XX:+PrintGCDetails 命令打印 GC 详细日志。

JVM在进行垃圾回收的过程中，会涉及到对象的移动。为了保证对象引用过程中不被修改，必须暂停所有用户线程。这样的停顿称为Stop The World，简称STW。

JVM 会使用一个名为安全点(Safe Point)的机制来确保线程能够安全地暂停。通常位于方法调用、循环跳转、异常处理等位置。其过程包括四个步骤

JVM发出暂停信号
线程执行到安全点后，挂起自身并等待垃圾收集完成
垃圾回收器完成操作
线程恢复执行

该机制会导致应用程序的响应延迟，可能会出现短暂的卡顿。对于高并发任务，频繁或长时间的STW会严重影响到服务的响应时间。但在现代垃圾回收器中，STW导致的性能问题已经能得到较好解决。

内存布局

对象在内存中包括三部分：对象头、实例数据与对齐填充。

对象头在32位JVM上是8字节，在64位JVM上是16字节（压缩指针后是12字节）。对象头包括

Mark Word：用于存储对象自身运行时数据，如哈希码、GC分代、锁状态、持有锁、偏向线程ID、偏向时间戳等。详见上一篇文章
类型指针：即对象指向它的类元数据的指针，JVM通过这个指针确定这个对象是哪个类的实例。
如果是数组，对象头还有一块用于记录数据长度的数据。

在JDK 8中，只要堆内存不大于32GB，类型指针默认会被压缩，以节省内存空间。比如说在开启压缩指针的情况下占 4 个字节，否则占 8 个字节。

JVM会对实例数据进行对齐/重排，以提高内存访问速度。
HotSpot JVM 一般会对数据进行8字节对齐。因为常用的64位CPU进行内存访问时，一次寻址的指针大小是8字节，且 L1 Cache 缓存行的大小通常是 64 字节。若未对齐访问：

CPU需要发起两次内存访问（而非一次）
可能发生并发问题
可能造成缓存行污染，即加载一个对象需要占用两个缓存行。
可能造成伪共享，即两个无关的变量在同一个缓存中，当一个线程修改其中的一个变量时，会导致整个缓存行失效。

一个new Object()对象在64位的JVM上的大小是16字节（8字节的 Mark Word + 4字节的类型指针 + 4字节的对齐填充）。而一般而言，一个对象的引用占4个字节（在压缩指针的情况下）。

对象访问

JVM一般通过两种方式访问对象：句柄和直接指针。
句柄访问中，reference 中存储的是对象的句柄地址，而句柄中则包含了对象实例数据和类型数据各自的具体地址信息。优点是在对象移动时较为稳定，只需要更新句柄池中“实例数据指针”的值就行。这对垃圾收集算法非常友好。但缺点是访问速度较慢。
直接指针访问则引用直接存储对象的地址，通过对象实例内部的“类型数据指针”再找到方法区中的类信息。优点是访问速度快，缺点是在垃圾收集器移动对象时，需要更新所有指向该对象的 reference，开销较大。这是 HotSpot VM 等主流虚拟机默认采用的方式。

对象引用

对象的引用有4种：强引用、软引用、弱引用和虚引用。

强引用：最普遍的引用类型。只有在该对象不可达时垃圾收集器才会回收。一般 new 出来的对象就是强引用。
软引用：描述一些还有用但非必需的对象。在内存即将溢出前，垃圾收集器会把这些对象列入回收范围进行第二次回收。若回收后内存还是不够则抛出OOM错误。
弱引用：强度比软引用更弱，只要发生 GC 就会被回收，只能活到下一次垃圾收集器发生之前。
虚引用：最弱的一种引用关系。
完全无法通过虚引用来获取一个对象。其get()方法总返回null。
必须与 ReferenceQueue（引用队列）联合使用。
GC 在回收对象之前，会将该虚引用加入引用队列，程序可通过队列感知对象即将被回收，从而执行堆外内存释放等清理操作。

逃逸分析

逃逸分析的核心目的是分析一个新创建的对象在方法中定义后，其引用是否会被暴露到方法之外，即这个对象的“活动范围”是否会“逃逸”出当前方法或当前线程。

根据对象的作用域，可以将对象分为3种状态：

不逃逸。对象仅在当前方法内部使用，也没有被其他线程操作的可能。
方法逃逸。对象的引用被传递到其他方法中，或者作为返回值返回。
线程逃逸。对象的引用被赋值给了一个可以被其他线程访问的实例变量（如静态变量），或者在一个线程中创建并启动另一个线程中直接使用。

对于不逃逸的对象，JVM 对对象进行标量替换，将对象拆解为若干个成员变量，直接在栈上分配，无需 GC 回收。

对于不会发生线程逃逸的对象，若其被证实不会发生线程逃逸，那么JVM就可以移除这个对象上的所有 synchronized 块。

逃逸分析是 JIT 在编译器在运行时进行的优化。由于算法开销较大，因此 JVM 往往只对热点代码进行分析。

内存溢出和内存泄漏

内存溢出指程序在申请内存时发现内存不够了，此时程序就会跑出OOM(OutOfMemoryError)，一般是因为堆内存或者机器内存太小，或者内存中存在大量无法回收的对象。

内存泄漏指程序在申请内存后，无法释放已经不再使用的对象的内存。这是导致内存溢出的常见原因。

发生内存泄漏有以下可能原因

静态集合类持有对象引用，导致对象无法被回收。这是最常见的情况。
数据库链接、网络链接、文件流等资源使用后没有正确关闭，导致资源泄漏甚至内存泄漏，因为这些对象可能持有缓冲区或其他大型对象的引用。
监听器或回调函数在不需要时没有注销，那么发布者会一直持有对监听器的引用。
非静态内部类（包括匿名内部类）会隐式持有其外部类引用（如后台线程）。内部类不回收时外部类也不会回收。
使用强引用构建内存，并且没有有效的淘汰策略。
ThreadLocal中存储了对象且没有在任务结束后调用ThreadLocal.remove()进行清理，那么对象就会一直存在线程的ThreadLocalMap中。

垃圾收集

判断

判断一个对象是不是垃圾主要有两种方法：引用计数算法和可达性分析算法。

引用计数算法在对象中添加一个引用计数器，当计数器为0时不再被使用。该方法实现简单，但不能处理对象之间相互循环引用的问题。因此这不是目前JVM使用的算法。

目前主流JVM均使用可达性分析算法。其通过一系列GC Roots的根对象作为起始节点集，然后从这个节点开始，根据引用关系向下搜索。搜索的路径称为引用链。若某个对象到GC Roots没有任何引用链相连，那么该对象不再被使用。

一般GC Roots包含以下对象

虚拟机栈（栈帧中的局部变量表）中引用的对象。
native方法引用的对象。
静态属性引用的对象。
方法区中常量引用的对象。
Java虚拟机内部引用。例如基本数据类型对应的Class对象，还有一些常驻的异常对象。
所有被synchronize持有的对象。
反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

即使是被标记为不可达对象，也并非是“非死不可”的。

经过可达性分析后，不可达的对象会被第一次标记。随后 JVM 判断是否有必要执行 finalize() 方法。

若没有重写该方法，或者该方法已经被执行过，那么不需要执行。
若有必要执行，则放入 F-Queue 队列，由 JVM 创建的低优先级 Finalizer 线程异步执行。

此后，对 F-Queue 中的对象进行第二次标记，如果对象在 finalize() 中重新与 GC Roots 建立引用关系，就可以“自救成功”，免于回收。

finalize()方法运行代价高昂，不确定性大，无法保证对象的调用顺序，已被废弃。因此一般使用 try-finally 或其他方式来做此类清理工作。

清理

回收算法

在确定了垃圾对象后，不同的收集算法采用了不同的回收策略。主要可以分为以下几类：

标记-清除算法
最基础的收集算法。它将要清理的对象分为“标记”和“清除”两个阶段。首先标记出所有需要回收的对象，然后统一回收所有被标记的对象。这样做虽然实现简单，也不需要移动对象，但标记和清除的效率都不高，且容易产生大量不连续的内存碎片。
标记-复制算法
将可用内存按容量分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将存活对象复制到另一块，然后再清空已使用空间。实现简单的同时还避免产生内存碎片。但这样就浪费了一半的内存。同时其标记和复制阶段都会有 STW。
标记-整理算法
标记完成后，让所有存活的对象都向内存空间的一端移动，然后直接清理掉边界之外的内存。这样就没有内存碎片，也没有空间浪费。但这种操作由于需要移动对象，所以需要STW。
分代收集算法
目前商业虚拟机的普遍做法。新生代中使用标记-复制算法，老年代使用标记-清除或标记-整理算法。因为新生代中大部分对象生命周期较短，复制算法可以实现快速回收。老年代中对象生命周期长，复制算法浪费时间。

GC分类

前面提及了许多种GC机制，此处做一个总结

Minor GC / Young GC：发生在年轻代的垃圾收集。
Major GC / Old GC：发生在老年代的垃圾收集，是CMS的特有行为
Mixed GC：G1收集器特有，在一次GC中同时清理年轻代和部分老年代
Full GC：最彻底的垃圾收集，涉及整个Java堆和方法区，最为耗时，往往在JVM压力很大时发生。

在 Minor GC 前，JVM 若发现老年代最大可用连续空间小于历次 Minor GC 后晋升对象的平均大小，说明本次 Minor GC 后升入老年代的对象大小很可能超过了老年代当前可用的内存空间，就会触发 Full GC。

空间分配担保是指在进行 Minor GC 前，JVM会确保老年代有足够的空间存放从新生代晋升的对象。如果老年代空间不足，可能会触发 Full GC。

垃圾收集器种类

名称	分代	线程模式	回收算法	搭配	说明
`Serial`	新生代	串行	复制	可与`Serial Old`搭配	最古老最基础的收集器，是Client模式下的默认新生代收集器
`ParNew`	新生代	并行	复制	是`CMS`默认的新生代搭配	本质上是`Serial`的多线程版本， JDK 5时，只有它能和`CMS`配合工作
`Parallel Scavenge`	新生代	并行	复制	与`Parallel Old`搭配	JDK 8的默认配置 $吞吐量=\frac{运行用户代码时间}{运行用户代码时间\ +\ 垃圾收集时间}$ 该收集器的目标是达到一个可控制的吞吐量。高吞吐量意味着高效率利用CPU时间，适合在后台进行运算而不需要太多交互的任务
`Serial Old`	老年代	串行	整理	可与`Serial`/`Parallel Scavenge`搭配	主要意义也是在于给Client模式下的虚拟机使用。在Server模式下，它主要作为CMS收集器的后备预案，在并发收集发生`Concurrent Mode Failure`时使用。
`Parallel Old`	老年代	并行	整理	与`Parallel Scavenge`搭配	是 `Parallel Scavenge`的老年代版本，二者组合是一个吞吐量优先的经典组合，适合关注吞吐量和CPU资源敏感的应用。
`CMS`	老年代	并发	清除	与 `ParNew` 搭配	见下
`G1`	全堆	并发+并行	整体整理，局部复制	逻辑分代，物理不分代	见下
`ZGC`	全堆	并发	染色指针+读屏障	自身管理，不分代	见下

CMS(COncurrent Mark-Sweep)，在JDK 1.5时引入，JDK 9时标记为弃用，JDK 14时移除。CMS 是 HotSpot 中首个以低延迟为目标的垃圾收集器。

CMS示意图

初始标记。标记出GC Roots能直接关联到的对象。该阶段单线程进行，且需要STW。但由于只标记直接关联的对象，所以停顿时间非常短。
并发标记。从初始标记的对象开始，进行GC Roots 追踪，标记出所有存活的对象。这个过程是和用户线程并发执行的。该过程耗时最长，但不需要STW，也不会影响程序响应速度。
重新标记。修正在并发标记期间因程序运作而导致变动的记录，需要STW，但时间非常短。
并发清除。清理掉死亡对象，回收占用的空间。

因此，CMS在整个收集过程种只有两次短暂的停顿，极大改善了用户体验。但是CMS也存在一些问题。

并发时占用CPU资源而导致总吞吐量降低
无法对在并发标记和并发清理阶段产生的新垃圾进行清理
可能会产生内存碎片
若在垃圾清理时，老年代没有足够空间容纳新生代上来的对象，JVM将不得不使用Serial Old收集器进行重新垃圾收集，大大拖慢速度。

G1(Garbage First)收集器在JDK 1.7时引入，在JDK 9时成为默认的收集器，其运作更加复杂。

G1 依然保留新生代和老年代的概念，只是在物理上把堆分成大小相等的 Region，每个 Region 一旦被指定为相应的代，则在本轮回收周期内，其角色都是固定的，从而能通过动态增减不同角色的 Region 数量来实现分代策略。

年轻代 GC
当 Eden 区被对象填满时触发。全程 STW，然后把还存活的对象复制到 Survivor 区或老年代。
全局并发标记周期（核心阶段）
当整个堆内存的使用量超过一定比例（在 JDK8/9 时默认 45%，JDK10+ 开始引入了自适应 IHOP 机制，会根据历史数据动态调整）时，G1 会启动一个完整的标记流程，目的是统计各 Region 存活对象比例。这个周期分几步走：
1. 初始标记：STW，快速标记那些直接被 GC Roots 引用到的对象。
2. 根区域扫描：并发进行，不暂停应用。主要扫描 Survivor 区对象对老年代的引用。这一步应该在下次年轻代 GC 前完成，否则就中止当前并发标记周期。
3. 并发标记：同样不暂停应用，系统会顺着 GC Roots 遍历整个堆，找出所有存活对象。G1 采用 SATB 协议，靠预写屏障把并发阶段发生的引用变更记录到 SATB 队列，最终标记再处理，以确保标记期间新产生的垃圾不会干扰本次回收。
4. 最终标记：STW，处理并发标记期间因程序运行产生的变动记录。
5. 清理准备：并发执行，汇总在并发标记阶段中队每个 Region 的“存活度”和“回收代价”，排出优先级，并直接回收那些完全空闲的 Region。
6. 并发清理：把在标记阶段发现的完全空闲区域重置归还。
混合回收
标记完成后，G1 会优先回收垃圾比例最高、收益最大的老年代 Region。之后连续执行多次 Mixed GC，直到回收收益不足或堆空间充足。
后备方案：Full GC
如果上述回收速度跟不上对象分配的速度，或者回收过程找不到足够空闲 Region 来复制，G1 会启用最后的保障——一次完全的 Full GC。Hotspot 目前只有 Serial Old 作为 G1 的 Full-GC 垃圾收集器，因此暂停时间会比较长，是 G1 尽力避免发生的情况。

ZGC 是 JDK11 时引入的低延迟垃圾处理器，理论上可以将垃圾收集的停顿时间控制在 10ms 内。而从 JDK16 起，一般场景已经能压到 1ms 以下，它通过并发标记和重定位来避免大部分 STW，主要依赖染色指针来管理对象状态。

ZGC 从64位指针中“偷”出几个比特位来存储与垃圾收集相关的元数据（如标记、重定位信息）。同时，使用了读屏障技术，当线程读取一个对象指针时，读屏障会检查这个指针上的“染色”信息。如果这个对象正在处于并发移动中，读屏障会透明修正引用。并返回对象的新地址，同时甚至会帮忙完成这个对象的移动和指针的更新，对应用完全无感知。

适用于需要超低延迟的场景，如金融交易系统、电商平台。

类加载机制

类加载过程

类的生命周期，从被加载到虚拟机内存中开始到被卸载为止，共经历7个阶段

graph LR
    load[加载]
    subgraph link[链接]
        verify[验证]
        prepare[准备]
        resolute[解析]
    end
    initialize[初始化]
    use[使用]
    unload[卸载]
    load-->verify-->prepare-->resolute-->initialize-->use-->unload

而类的加载过程包括三个阶段：加载，链接和初始化。

加载
1. 通过全类名获取定义此类的二进制字节流
2. 将字节流所代表的静态存储结构转换为方法区运行时数据结构
3. 内存中生成一个代表该类的 Class 对象，作为方法区这些数据的访问入口
每个Java类都有一个引用指向加载它的 ClassLoader
验证是链接阶段的第一步
1. 文件格式验证，Class文件格式检查
2. 元数据验证，对类的元数据信息进行语义校验
3. 字节码验证，对方法体的字节码进行数据流和控制流分析
4. 符号引用验证，类的正确性检查
准备
正式为类变量分配内存并设置变量初始值，此时为静态变量进行内存分配并设置默认零值。
解析
虚拟机将常量池内符号引用替换为直接引用的过程。

符号引用用一组符号来描述引用的目标，如com/example/MyClass等。
直接引用则是直接指向内存的指针。
初始化
开始执行初始化方法<clinit>()的过程。准备阶段中对一些静态变量赋过零值了，此时会赋值为期望值。

类加载器

类加载器主要有4种

启动类加载器：负责加载JVM核心库，也是最顶层的加载类，由C++实现，通常表示为null，因为这个加载器没有对应的 Java 类
扩展类加载器：负责加载%JRE_HOME%/lib/ext 目录下的 jar 包和类以及被 java.ext.dirs 系统变量所指定的路径下的所有类
应用程序类加载器：也叫系统类加载器，加载当前应用目录下的所有jar包和类
用户自定义的类加载器：通过继承java.lang.ClassLoader实现

flowchart BT
    bootstrap[启动类加载器]
    extension[扩展类加载器]
    app[应用程序类加载器]
    custom1[自定义类加载器1]
    custom2[自定义类加载器2]
    custom3[自定义类加载器3]
    custom3-->custom1-->app-->extension-->bootstrap
    custom2-->app

选用加载器时，一般选用双亲委派模型，即先委托父加载器尝试加载，只有父加载器无法加载时，子加载器才会加载。又或者说，自底向上查找判断类是否被加载，然后自顶向下尝试加载类。无法加载类则会抛异常ClassNotFoundException。

该模型的优点有两个

安全。Java 中的类的唯一性是由类的全限定名和定义它的类加载器共同实现的。
比如，用户也写一个 java.lang.String ，在双亲委派下会被启动类加载器拦截，直接返回核心库的 String，避免注入风险。
避免重复加载。不会出现多个类加载加载同一个类的情况，永远只以上一个的为准。

自定义加载器时，若不想打破双亲委派模型，则重写ClassLoader类中的findClass()方法；若需要打破双亲委派模型，则重写ClassLoader类中的loadClass()方法。

打破该模型的应用有很多

SPI机制
SPI(Service Provider Interface)是Java的一种扩展机制，用于加载和注册第三方库，常见于JDBC等框架。

接口由核心库提供（启动类加载器加载），实现类由第三方 jar 提供（应用类加载器加载）。双亲委派下，启动类加载器无法加载应用类路径的实现，因此使用线程上下文类加载器，让父加载器反向委托子加载器完成加载。
热部署
指在不重启服务器的情况下更新应用程序的代码，需要替换旧版本的类，但旧版本的类可能由父加载器加载。如spring boot DevTools通常会自定义加载器。
Tomcat
Tomcat基于双亲委派模型进行了一些扩展。其中Catalina ClassLoader加载Tomcat的核心类库，Shared ClassLoader加载共享类库，WebApp ClassLoader加载Web应用程序的类库，支持多应用隔离和优先加载应用自定义的类库。

flowchart BT
app[应用程序类加载器]
common[通用自定义类加载器]
shared[共享类加载器]
webapp[web应用类加载器]
catalina[Catalina类加载器]
webapp-->shared-->common-->app
catalina-->common

web

#java

JVM的底层实现

https://ivanclf.github.io/2025/10/06/jvm/

作者

Ivan Chan

发布于

2025年10月6日

许可协议

JDK 工具和 JVM 调优上一篇

并发基础 - 2 下一篇