JVM垃圾收集器详解

垃圾收集器有哪些？

Serial 收集器

Parallel Scavenge收集器

ParNew收集器

CMS收集器

G1收集器

如果说收集算法是内存回收的方法论，那么垃圾收集器就是内存回收算法的具体实现。虽然我们对各个收集器进行比较，但并非为了挑选出一个最好的收集器。因为直到现在为止还没有最好的垃圾收集器出现，更加没有万能的垃圾收集器，我们能做的就是根据具体应用场景选择适合自己的垃圾收集器。试想一下：如果有一种四海之内、任何场景下都适用的完美收集器存在，那么我们的Java虚拟机就不会实现那么多不同的垃圾收集器了。

虚拟机运行模式

目前java虚拟机有两种模式，分别为Client模式和Server模式。这两种模式可以使用-Client和-Server参数可以进行设置。如果没有设置的话，怎么办呢？那当然难不倒虚拟机，以它的智商当然会根据当前计算机系统环境自动选择运行模式。

那它怎么检测呢？当不指定运行模式参数时，虚拟机启动检测主机是否为服务器，如果是，则以Server模式启动，否则以Client模式启动（J2SE5.0检测的根据是至少2个CPU和最低2GB内存）

Serial收集器(-XX:+UseSerialGC -XX:+UseSerialOldGC)

可应用于年轻代和老年代，新生代采用复制算法，老年代采用标记-整理算法

Serial（串行）收集器是最基本、历史最悠久的垃圾收集器了。大家看名字就知道这个收集器是一个单线程收集器了。它的 “单线程” 的意义不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作，更重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程STW（ “Stop The World” ），直到它收集结束。

虚拟机的设计者们当然知道Stop The World带来的不良用户体验，所以在后续的垃圾收集器设计中停顿时间在不断缩短（仍然还有停顿，寻找最优秀的垃圾收集器的过程仍然在继续）。但是Serial收集器有没有优于其他垃圾收集器的地方呢？当然有，它简单而高效（与其他收集器的单线程相比）。Serial收集器由于没有线程交互的开销，自然可以获得很高的单线程收集效率。 Serial Old收集器是Serial收集器的老年代版本，它同样是一个单线程收集器。它主要有两大用途：一种用途是在JDK1.5以及以前的版本中与Parallel Scavenge收集器搭配使用，另一种用途是作为CMS收集器的后备方案

特点：
1、单线程，简单而高效
2、作为CMS的后备方案

Parallel Scavenge收集器(-XX:+UseParallelGC(年轻代),-XX:+UseParallelOldGC(老年代))

就是Serial的多线程版本，新生代采用复制算法，老年代采用标记-整理算法。Parallel收集器其实就是Serial收集器的多线程版本，除了使用多线程进行垃圾收集外，其余行为（控制参数、收集算法、回收策略等等）和Serial收集器类似。默认的收集线程数跟cpu核数相同，当然也可以用参数(-XX:ParallelGCThreads)指定收集线程数，但是一般不推荐修改

Parallel Scavenge收集器关注点是吞吐量（高效率的利用CPU）。CMS等垃圾收集器的关注点更多的是用户线程的停顿时间（提高用户体验）。所谓吞吐量就是CPU中用于运行用户代码的时间与CPU总消耗时间的比值。 Parallel Scavenge收集器提供了很多参数供用户找到最合适的停顿时间或最大吞吐量，如果对于收集器运作不太了解的话，可以选择把内存管理优化交给虚拟机去完成也是一个不错的选择。

特点

1、注重吞吐量（并发收集、调整合适的停顿时间）

2、JDK8默认的新生代和老年代收集器（Parallel Scavenge收集器和Parallel Old）

ParNew收集器(-XX:+UseParNewGC)

类似Parallel Scavenge ，一般用于年轻代垃圾收集，配合CMS使用。新生代采用复制算法，老年代采用标记-整理算法
起多个线程去并发进行垃圾回收，默认的收集线程数跟cpu核数相同，当然也可以用参数(-XX:ParallelGCThreads)指定收集线程数，但是一般不推荐修改。

它是许多运行在Server模式下的虚拟机的首要选择，除了Serial收集器外，只有它能与CMS收集器（真正意义上的并发收集器，后面会介绍到）配合工作。

“-XX:+UseConcMarkSweepGC”：指定使用CMS后，会默认使用ParNew作为新生代收集器；
“-XX:+UseParNewGC”：强制指定使用ParNew；
“-XX:ParallelGCThreads”：指定垃圾收集的线程数量，ParNew默认开启的收集线程与CPU的数量相同；

特点：

1、一般用户年轻代配合CMS老年代使用主流使用
2、性能好于Searial

CMS收集器（-XX:+UseConcMarkSweepGC）

CMS(Concurrent Mark Sweep 并发标记清除)是一种以获取最短停顿时间为目标的收集器，注重用户停用时间（STW）,实现了垃圾收集线程与用户线程并行执行，它是HotSpot虚拟机第一款真正意义上的并发收集器

采用标记清除算法，垃圾收集过程分的4个重要步骤

1、初始标记：STW暂停用户线程，记录GC Roots的直接应用对象，速度很快

2、并发标记：同事开启GC线程和用户线程，用一个闭包结构去记录可达对象，并发标记过程中会产生的新的引用变跟，所以GC线程无法保证可达性分析的实时性。

（预处理、可中断的预处理）

3、重新标记：STW,修正并发标记过程中产生的变动，时间大于初始标记且远远小于并发标记的时间

4、并发清理：开启用户线程，并清理未标记的做清除工作

（并发重置）

特点：

1、并发收集、低停顿（获取最短停顿时间）

2、对CPU资源敏感，和用户服务线程抢资源

3、使用标记清除算法，会遗留大量碎片化空间；通过参数-XX:+UseCMSCompactAtFullCollection 可以让jvm在执行完标记清除后再做整理

4、执行过程的不确定性，可能上一次还没执行完成，又在触发fullGC,也就是”concurrent mode failure”，此时会进入STW，用serial old垃圾收集器来回收

CMS相关参数

1、-XX:+UseConcMarkSweepGC：启动CMS

2、-XX:ConcGCThreads：并发GC线程数

3、-XX:UserCMSCompactAtFullCollection：FullGC后做压缩整理（减少碎片）

4、-XX:CMSFullGCsBeforeCompaction：多少次FullGC才触发一次压缩，默认0，一次FullGC压缩一次

5、-XX:CMSInitiatingOccupancyFraction：当老年代使用比例达到该比例是会触发FullGC,默认百分之92

6、-XX:+UseCMSInitiatingOccupancyOnly：只使用-XX:CMSInitiatingOccupancyFraction设置的值来设置比例，不然只有第一次使用设定值，后面会自动调整

7、-XX:CMSScavengeBeforeRemark：在CMSGC启动前先触发一次YougGC，目的是为了减少老年代对年轻代的引用，减低CMS GC标记阶段的开销，，一般CMS的GC耗时 80%都在 remark阶段

亿级流量电商系统如何优化JVM参数设置(ParNew+CMS)

大型电商系统后端现在一般都是拆分为多个子系统部署的，比如，商品系统，库存系统，订单系统，促销系统，会员系统等等。

我们这里以比较核心的订单系统为例对于8G内存，我们一般是分配4G内存给JVM，正常的JVM参数配置如下：

1	`‐Xms3072M ‐Xmx3072M ‐Xmn1536M ‐Xss1M -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M ‐XX:SurvivorRatio=8`

系统按每秒生成60MB的速度来生成对象，大概运行20秒就会撑满eden区，会出发minor gc，大概会有95%以上对象成为垃圾被回收，可能最后一两秒生成的对象还被引用着，我们暂估为100MB左右，那么这100M会被挪到S0区，回忆下动态对象年龄判断原则，这100MB对象同龄而且总和大于S0区的50%，那么这些对象都会被挪到老年代，到了老年代不到一秒又变成了垃圾对象，很明显，survivor区大小设置有点小

我们分析下系统业务就知道，明显大部分对象都是短生存周期的，根本不应该频繁进入老年代，也没必要给老年代维持过大的内存空间，得让对象尽量留在新生代里。于是我们可以更新下JVM参数设置：

1	`-Xms3072M ‐Xmx3072M ‐Xmn2048M ‐Xss1M -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M ‐XX:SurvivorRatio=8`

这样就降低了因为对象动态年龄判断原则导致的对象频繁进入老年代的问题，其实很多优化无非就是让短期存活的对象尽量都留在survivor里，不要进入老年代，这样在minor gc的时候这些对象都会被回收，不会进到老年代从而导致full gc。

对于对象年龄应该为多少才移动到老年代比较合适，本例中一次minor gc要间隔二三十秒，大多数对象一般在几秒内就会变为垃圾，完全可以将默认的15岁改小一点，比如改为5，那么意味着对象要经过5次minor gc才会进入老年代，整个时间也有一两分钟了，如果对象这么长时间都没被回收，完全可以认为这些对象是会存活的比较长的对象，可以移动到老年代，而不是继续一直占用survivor区空间。对于多大的对象直接进入老年代(参数-XX:PretenureSizeThreshold)，这个一般可以结合你自己系统看下有没有什么大对象生成，预估下大对象的大小，一般来说设置为1M就差不多了，很少有超过 1M的大对象，这些对象一般就是你系统初始化分配的缓存对象，比如大的缓存List，Map之类的对象。可以适当调整JVM参数如下：

1 2	`-Xms3072M -Xmx3072M -Xmn2048M -Xss1M -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -XX:PretenureSizeThreshold=1M`

对于老年代CMS的参数如何设置我们可以思考下，首先我们想下当前这个系统有哪些对象可能会长期存活躲过5次以上minor gc最终进入老年代。无非就是那些Spring容器里的Bean，线程池对象，一些初始化缓存数据对象等，这些加起来充其量也就几十MB。还有就是某次minor gc完了之后还有超过200M的对象存活，那么就会直接进入老年代，比如突然某一秒瞬间要处理五六百单，那么每秒生成的对象可能有一百多M，再加上整个系统可能压力剧增，一个订单要好几秒才能处理完，下一秒可能又有很多订单过来。我们可以估算下大概每隔五六分钟出现一次这样的情况，那么大概半小时到一小时之间就可能因为老年代满了触发一次Full GC，Full GC的触发条件还有我们之前说过的老年代空间分配担保机制，历次的minor gc挪动到老年代的对象大小肯定是非常小的，所以几乎不会在minor gc触发之前由于老年代空间分配担保失败而产生full gc，其实在半小时后发生full gc，这时候已经过了抢购的最高峰期，后续可能几小时才做一次FullGC。

对于碎片整理，因为都是1小时或几小时才做一次FullGC，是可以每做完一次就开始碎片整理。综上，只要年轻代参数设置合理，老年代CMS的参数设置基本都可以用默认值，如下所示：

1
2
3

-Xms3072M -Xmx3072M -Xmn2048M -Xss1M  -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M  -XX:SurvivorRatio=8 
-XX:MaxTenuringThreshold=5 -XX:PretenureSizeThreshold=1M -XX:+UseParNewGC -XX:+UseConcMarkSweepGC 
-XX:CMSInitiatingOccupancyFraction=92 -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=3

G1收集器（-XX:+UseG1GC）

G1 (Garbage-First)是一款面向服务器的垃圾收集器，主要针对配备多颗处理器及大容量内存的机器，以极高的概率满足GC停顿时间的要求的同时，还满足高吞吐的性能要求

G1将Java堆划分为多个大小相等的独立区域（Region），JVM最多可以有2048个Region。一般Region大小等于堆大小除以2048，比如堆大小为4096M，则Region大小为2M，当然也可以用参数”-XX:G1HeapRegionSize”手动指定Region大小，但是推荐默认的计算方式。 G1保留了年轻代和老年代的概念，但不再是物理隔阂了，它们都是（可以不连续）Region的集合。

默认年轻代对堆内存的占比是5%，如果堆大小为4096M，那么年轻代占据200MB左右的内存，对应大概是100个Region，可以通过“-XX:G1NewSizePercent”设置新生代初始占比，在系统运行中，JVM会不停的给年轻代增加更多的Region，但是最多新生代的占比不会超过60%，可以通过“-XX:G1MaxNewSizePercent”调整。

年轻代中的Eden和Survivor对应的region也跟之前一样，默认8:1:1，假设年轻代现在有1000个region，eden区对应800个，s0对应100个，s1对应 100个。一个Region可能之前是年轻代，如果Region进行了垃圾回收，之后可能又会变成老年代，也就是说Region的区域功能可能会动态变化。

G1垃圾收集器对于对象什么时候会转移到老年代跟之前讲过的原则一样，唯一不同的是对大对象的处理，G1有专门分配大对象的Region叫Humongous区，而不是让大对象直接进入老年代的 Region中。在G1中，大对象的判定规则就是一个大对象**超过了一个Region大小的50%**，比如按照上面算的，每个Region是2M，只要一个大对象超过了1M，就会被放入Humongous中，而且一个大对象如果太大，可能会横跨多个Region来存放。

Humongous区专门存放短期巨型对象，不用直接进老年代，可以节约老年代的空间，避免因为老年代空间不够的GC开销。 Full GC的时候除了收集年轻代和老年代之外，也会将Humongous区一并回收。

G1收集器一次GC的运作过程大致分为以下几个步骤：

1、初始标记，同CMS

2、并发标记，同CMS

3、最终标记，同CMS重新标记

4、筛选回收，筛选回收阶段首先对各个Region的回收价值和成本进行排序，根据用户所期望的GC停顿时间(可以用JVM参数 -XX:MaxGCPauseMillis指定)来制定回收计划，比如说老年代此时有1000个Region都满了，但是因为根据预期停顿时间，本次垃圾回收可能只能停顿200毫秒，那么通过之前回收成本计算得知，可能回收其中800个 Region刚好需要200ms，那么就只会回收800个Region，尽量把GC导致的停顿时间控制在我们指定的范围内。这个阶段其实也可以做到与用户程序一起并发执行，但是因为只回收一部分Region，时间是用户可控制的，而且停顿用户线程将大幅提高收集效率。不管是年轻代或是老年代，回收算法主要用的是复制算法，将一个region中的存活对象复制到另一个 region中，这种不会像CMS那样回收完因为有很多内存碎片还需要整理一次，G1采用复制算法回收几乎不会有太多内存碎片

G1收集器在后台维护了一个优先列表，每次根据允许的收集时间，优先选择回收价值最大的 Region(这也就是它的名字Garbage-First的由来)，比如一个Region花200ms能回收10M垃圾，另外一个Region花50ms能回收20M垃圾，在回收时间有限情况下，G1当然会优先选择后面这个Region回收。这种使用Region划分内存空间以及有优先级的区域回收方式，保证了G1收集器在有限时间内可以尽可能高的收集效率。

G1被视为JDK1.7以上版本Java虚拟机的一个重要进化特征。它具备以下特点

1、并行与并发：存在并发标记，并发回收的过程，充分利用cpu资源

2、分代收集：虽然G1可以不需要其他收集器配合就能独立管理整个GC堆，但是还是保留了分代的概念

3、空间整理：与CMS的“标记–清理”算法不同，G1从整体来看是基于“标记整理”算法实现的收集器；从局部上来看是基于“复制”算法实现的。

4、可预测的停顿（适合大内存）：这是G1相对于CMS的另一个大优势，降低停顿时间是G1 和 CMS 共同的关注点，但G1 除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为M毫秒的时间片段(通过参数”-XX:MaxGCPauseMillis”指定)内完成垃圾收集

5、Humongous区存放短期大对象

6、除了Youg GC，Old GC，还存在Mixed GC,

G1收集器参数设置

1、-XX:+UserG1GC:使用G1收集器

2、-XX:ParallelGCThreads:指定GC工作的线程数量

3、-XX:G1HeapReginSize:指定region分区大小（1-32M 必须是2的幂），默认将堆划分为2048个分区

4、-XX:MaxGCPauseMillis:目标暂停时间（默认200ms）

5、-XX:G1NewSizePercent:新生代内存默认初始比例（默认比例5%）

6、-XX:G1MaxNewSizePercent:新生代内存最大空间

7、-XX:TargetSurvivorRatio:Survivor区的填充容量(默认50%)，Survivor区域里的一批对象(年龄 1+年龄2+年龄n的多个年龄对象)总和超过了Survivor区域的50%，此时就会把年龄n(含)以上的对象都放入老年代

8、-XX:MaxTenuringThreshold:最大年龄阈值（默认年龄15进入老年代）

9、-XX:InitiatingHeapOccupancyPercent:老年代占用空间达到整堆内存阈值(默认45%)，则执行新生代和老年代的混合收集(MixedGC)，比如我们之前说的堆默认有2048个region，如果有接近 1000个region都是老年代的region，则可能就要触发MixedGC了

10、-XX:G1HeapWastePercent(默认5%): gc过程中空出来的region是否充足阈值，在混合回收的时候，对Region回收都是基于复制算法进行的，都是把要回收的Region里的存活对象放入其他 Region，然后这个Region中的垃圾对象全部清理掉，这样的话在回收过程就会不断空出来新的 Region，一旦空闲出来的Region数量达到了堆内存的5%，此时就会立即停止混合回收，意味着本次混合回收就结束了

11、-XX:G1MixedGCLiveThresholdPercent(默认85%) region中的存活对象低于这个值时才会回收该region，如果超过这个值，存活对象过多，回收的的意义不大。

12、-XX:G1MixedGCCountTarget:在一次回收过程中指定做几次筛选回收(默认8次)，在最后一个筛选回收阶段可以回收一会，然后暂停回收，恢复系统运行，一会再开始回收，这样可以让系统不至于单次停顿时间过长。

G1垃圾收集类别

Youg GC

YoungGC并不是说现有的Eden区放满了就会马上触发，而且G1会计算下现在Eden区回收大概要多久时间，如果回收时间远远小于参数 -XX:MaxGCPauseMills 设定的值，那么增加年轻代的region，继续给新对象存放，不会马上做Young GC，直到下一次Eden区放满，G1计算回收时间接近参数 -MaxGCPauseMillis设定的值，那么就会触发Young GC

根据 -XX:MaxGCPauseMills 设定值判断是否要进行YougGC

Mixed GC

不是FullGC，老年代的堆占有率达到参数(-XX:InitiatingHeapOccupancyPercen)设定的值则触发，回收所有的Young和部分Old(根据期望的GC停顿时间确定old区垃圾收集的优先顺序)以及大对象区，正常情况G1的垃圾收集是先做MixedGC，主要使用复制算法，需要把各个region中存活的对象拷贝到别的region里去，拷贝过程中如果发现没有足够的空region能够承载拷贝对象就会触发一次Full GC

老年代堆占有率达到阈值触发Mixed GC

Old GC

停止系统程序，然后采用单线程进行标记、清理和压缩整理，好空闲出来一批Region来供下一次MixedGC使用，这个过程是非常耗时的。

G1垃圾收集器优化建议

假设参数 -XX:MaxGCPauseMills 设置的值很大，导致系统运行很久，年轻代可能都占用了堆内存的60%了，此时才触发年轻代gc。那么存活下来的对象可能就会很多，此时就会导致Survivor区域放不下那么多的对象，就会进入老年代中。或者是你年轻代gc过后，存活下来的对象过多，导致进入Survivor区域后触发了动态年龄判定规则，达到了Survivor区域的50%，也会快速导致一些对象进入老年代中。

所以这里核心还是在于调节 -XX:MaxGCPauseMills 这个参数的值，在保证他的年轻代gc别太频繁的同时，还得考虑每次gc过后的存活对象有多少,避免存活对象太多快速进入老年代，频繁触发mixed gc

年轻代大小：避免使用 -Xmn选项或 -XX:NewRatio 等其他相关选项显示设置年轻代大小
固定年轻代的大小会覆盖暂停时间目标
暂停时间目标不要太过严苛：G1 GC 的吞吐量目标是 90% 的应用程序时间和 10%的垃圾回收时间
评估G1 GC的吞吐量时，暂停时间目标不要太严苛，目标太过严苛表示你愿意承受更多的垃圾回收开销，而这会直接影响到吞吐量

几十万并发(大内存)的系统如何优化JVM

Kafka类似的支撑高并发消息系统大家肯定不陌生，对于kafka来说，每秒处理几万甚至几十万消息时很正常的，一般来说部署kafka需要用大内存机器(比如64G)，也就是说可以给年轻代分配个三四十G的内存用来支撑高并发处理，这里就涉及到一个问题了，我们以前常说的对于eden区的young gc是很快的，这种情况下它的执行还会很快吗？很显然，不可能，因为内存太大，处理还是要花不少时间的，假设三四十G内存回收可能最快也要几秒钟，按kafka这个并发量放满三四十G的eden区可能也就一两分钟吧，那么意味着整个系统每运行一两分钟就会因为young gc卡顿几秒钟没法处理新消息，显然是不行的。那么对于这种情况如何优化了，我们可以使用G1收集器，设置 -XX:MaxGCPauseMills 为50ms，假设50ms能够回收三到四个G内存，然后50ms的卡顿其实完全能够接受，用户几乎无感知，那么整个系统就可以在卡顿几乎无感知的情况下一边处理业务一边收集垃圾。

G1天生就适合这种大内存机器的JVM运行，可以比较完美的解决大内存垃圾回收时间过长的问题

如何选择垃圾收集器

1、优先调整堆的大小让服务器自己来选择

2、如果内存小于100M，使用串行收集器

3、如果是单核，并且没有停顿时间的要求，串行或JVM自己选择

4、如果允许停顿时间超过1秒，选择并行或者JVM自己选

5、如果响应时间最重要，并且不能超过1秒，使用并发收集器

下图有连线的可以搭配使用，官方推荐使用G1，因为性能高

G1和ParNew+CMS孰优孰劣？

场景	推荐收集器	理由
大堆（>16GB）	G1	分区模型优化内存使用，避免碎片化
低延迟小堆（<4GB）	ParNew + CMS	并发清除阶段资源占用低，延迟可控
吞吐量优先	Parallel Scavenge	G1 和 CMS 均侧重延迟，Parallel 更适合计算密集型任务
兼容旧系统	ParNew + CMS	避免参数迁移和稳定性风险

G1 的局限性

内存与 CPU 开销
G1 的 Remembered Set（便于扫描Region区域的对象是否处于可达路径中，避免全堆扫描）和 Card Table（Region 在逻辑上划分为若干个固定大小（介于128到512字节之间）的连续区域，每个区域称之为卡片 Card）机制需要额外内存（约 10%-20% 堆大小），且后台线程（如并发标记）可能占用较多 CPU，影响吞吐量
小堆性能劣势
在堆内存小于 4GB 时，G1 的分区管理可能带来额外开销，而 CMS 的简单分代模型更高效
Full GC 风险
G1 的 Full GC 退化为单线程 Serial Old，而 CMS 可通过 -XX:+UseCMSInitiatingOccupancyOnly 调整触发阈值。例如，内存分配过快时，G1 的 Full GC 可能导致更长的停顿。

综上所述，在小堆场景，过度优秀的垃圾收集算法比如G1需要占用更多的内存和CPU算力，反而会拖慢垃圾回收

CMS、G1、ZGC 对比

ZGC（Z Garbage Collector） 是面向低延迟的并发收集器；JDK 11 起实验可用，JDK 15 起正式可用于生产，典型启用：-XX:+UseZGC。下面先说明 G1 的 Remembered Set 与 ZGC 的染色指针，再对照总览表选型。

G1 的 Remembered Set（RSet）

G1 把堆划成多个 Region。回收某块区域时，除了本 Region 内的引用，还必须知道其他 Region 里是否有引用指向本 Region 中的对象（跨 Region、跨代引用）。若每次 Young GC / Mixed GC 都为找这类引用而扫描整个老年代，停顿会随堆增大而恶化。

Remembered Set（记忆集，常简称 RSet）：每个 Region 维护一份「外部有哪些地方引用指向本 Region」的摘要结构；实现上与 Card Table（卡表）、Per-Region Table 等配合，把跨区引用记录下来。
写屏障（Write Barrier）：在引用字段被写入时，由屏障逻辑把对应卡或结构标脏、并入 RSet 维护路径，保证 RSet 与堆上实际引用关系近似实时一致（具体精度与优化属于实现细节）。
作用：GC 根枚举时不必全堆扫描老年代，只按需遍历相关 RSet，是大堆下 G1 能把停顿控制在目标附近的关键机制之一。
代价：额外内存（实践中常与堆大小、Region 数、写操作频度相关，量级上常见为堆的若干～十几个百分点这一档的讨论）以及写屏障带来的 CPU 开销，对应下表里 G1「内存开销偏高」「CPU/吞吐量开销中高」等描述。

ZGC 的染色指针（Colored Pointers）

ZGC 在 64 位 环境下，利用引用（指针）中未被地址空间实际使用的高位比特（具体比特布局随 JDK 版本、平台与压缩指针设置而变）编码标记、重映射（Remap）等与并发回收相关的状态，相当于把少量 GC 元数据「染」进指针本身。

并发标记与并发整理/复制可与业务线程同时进行；对象被搬移后，不必在单次 STW 内改完所有指向它的引用，由于GC状态信息“随身携带”在指针上，当GC需要移动一个存活对象到新的内存位置（压缩/整理内存）时，它可以先移动对象，并只在指针被使用时，才通过“读屏障”来更新它。这允许了真正的、大范围的并发压缩，从而把极短的停顿集中在少数阶段。
与 G1 的对比：一般不采用 G1 那种按 Region 维护的大规模 RSet + 卡表 来刻画跨区引用，额外元数据的形态不同；代价是更依赖 读屏障 与染色指针在访问路径上的处理，典型取舍是用更多屏障与 CPU 换更可控的停顿、并避免 RSet 式结构占用的那类内存。

理解上述两点后，下表中的「内存模型」「内存开销」「CPU / 吞吐量」等行会更容易对应到各自实现。

特性维度	CMS	G1	ZGC
设计目标	低停顿	平衡吞吐量与可控停顿	极致低停顿，停顿与堆大小基本无关
内存模型	传统连续分代	分区（Region），逻辑分代	分区，基于染色指针
收集算法	标记-清除	整体标记-整理，局部复制	并发标记-复制/整理
最大停顿	中等（重新标记阶段往往较重）	可预测（通过 `-XX:MaxGCPauseMillis` 设定目标）	极短（常见亚毫秒～数毫秒级，视版本与负载而定）
内存开销	低（卡表等）	高（RSet + 卡表）	中（染色指针，无 RSet）
CPU / 吞吐量	中（并发线程）	中高（写屏障等开销）	高（读屏障等，吞吐相对更易受影响）
内存碎片	有（标记-清除）	基本无	无（并发压缩）
适用堆大小	中小堆（如 4～8GB 量级常见）	大堆（数十 GB～很大堆）	超大堆（数百 MB～16TB+ 量级，随 JDK 演进）
JDK 8 支持	是（已废弃，不建议新系统使用）	是（需 `-XX:+UseG1GC` 手动启用）	否
生产建议 JDK	不推荐作为新选型	JDK 8 大堆可首选 G1；JDK 9+ 默认多为 G1	JDK 15+ 低延迟、大堆场景可重点评估

选型建议

1. JDK 8 及以下

小堆、吞吐优先：使用默认的 Parallel Scavenge / Parallel Old（或由 JVM 自选）。
中等堆、关注停顿：可考虑 CMS（注意碎片与 Full GC 风险）。
大堆（如 >8GB）：建议升级到较新 JDK 并启用 G1。

2. JDK 11 / JDK 17+

通用业务：首选 G1（成熟、默认策略友好）。
对停顿极其敏感且堆较大（如数十 GB 以上）：在充分压测与监控前提下，可评估 ZGC（或同类低延迟收集器）。

24khandsome's Blog

性能调优13-JVM垃圾收集器详解