JVM终结篇
1 重新认知JVM
之前我们画过一张图,是从Class文件到类装载器,再到运行时数据区的过程。
现在咱们把这张图不妨丰富完善一下,展示了JVM的大体物理结构图。

2 GC优化
内存被使用了之后,难免会有不够用或者达到设定值的时候,就需要对内存空间进行垃圾回收。
2.1 垃圾收集发生的时机
GC是由JVM自动完成的,根据JVM系统环境而定,所以时机是不确定的。 当然,我们可以手动进行垃圾回收,比如调用 System.gc() 方法通知JVM进行一次垃圾回收,但是具体什么时刻运行也无法控制。也就是说 System.gc() 只是通知要回收,什么时候回收由JVM决定。 但是不建议手动调用该方法,因为消耗的资源比较大。
一般以下几种情况会发生垃圾回收
(1)当Eden区或者S区不够用了: Minor GC
(2)老年代空间不够用了: Major GC
(3)方法区空间不够用了: MetaSpace Gc
(4)System.gc()
2.2 实验环境准备
比如使用gp-jvm这个项目,然后配置对应的参数。
-XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc:gc.log

2.3 GC日志文件

要想分析日志的信息,得先拿到GC日志文件才行,所以得先配置一下,之前也看过这些参数。
-XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc:gc.log
然后启动项目
可以看到默认使用的是ParallelGC
2.3.1 Parallel GC日志
【吞吐量优先】
2019-06-10T23:21:53.305+0800: 1.303: [GC (Allocation Failure) [PSYoungGen: 65536K[Young区回收前]->10748K[Young区回收后] (76288K[Young区总大小])] 65536K[整个堆回收前]->15039K[整个堆回收后](251392K[整个堆总大小]), 0.0113277 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]
注意如果回收的差值中间有出入,说明这部分空间是Old区释放出来的

2.3.2 CMS日志
【停顿时间优先】
参数设置:
-XX:+UseConcMarkSweepGC -Xloggc:cms-gc.log

CommandLine flags: -XX:-BytecodeVerificationLocal -XX:-BytecodeVerificationRemote -XX:InitialHeapSize=267025984 -XX:+ManagementServer -XX:MaxHeapSize=4272415744 -XX:MaxNewSize=697933824 -XX:MaxTenuringThreshold=6 -XX:OldPLABSize=16 -XX:+PrintGC -XX:+PrintGCDateStamps -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:TieredStopAtLevel=1 -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseConcMarkSweepGC -XX:-UseLargePagesIndividualAllocation -XX:+UseParNewGC
2020-01-14T19:44:30.289+0800: 1.364: [GC (Allocation Failure) 2020-01-14T19:44:30.289+0800: 1.364: [ParNew: 69952K->8069K(78656K), 0.0079054 secs] 69952K->8069K(253440K), 0.0081187 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]
2020-01-14T19:44:30.677+0800: 1.752: [GC (Allocation Failure) 2020-01-14T19:44:30.677+0800: 1.752: [ParNew: 78021K->8704K(78656K), 0.0227731 secs] 78021K->14014K(253440K), 0.0228235 secs] [Times: user=0.11 sys=0.00, real=0.02 secs]
2020-01-14T19:44:30.701+0800: 1.776: [GC (CMS Initial Mark) [1 CMS-initial-mark: 5310K(174784K)] 14980K(253440K), 0.0011191 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
2020-01-14T19:44:30.702+0800: 1.777: [CMS-concurrent-mark-start]
...
2.3.3 G1日志
【停顿时间优先】
参数设置:
-XX:+UseG1GC -Xloggc:g1-gc.log理解G1日志格式:https://blogs.oracle.com/poonam/understanding-g1-gc-logs
-XX:+UseG1GC # 使用了G1垃圾收集器 # 什么时候发生的GC,相对的时间刻,GC发生的区域young,总共花费的时间,0.00478s, # It is a stop-the-world activity and all # the application threads are stopped at a safepoint during this time. 2019-12-18T16:06:46.508+0800: 0.458: [GC pause (G1 Evacuation Pause) (young), 0.0047804 secs] # 多少个垃圾回收线程,并行的时间 [Parallel Time: 3.0 ms, GC Workers: 4] # GC线程开始相对于上面的0.458的时间刻 [GC Worker Start (ms): Min: 458.5, Avg: 458.5, Max: 458.5, Diff: 0.0] # This gives us the time spent by each worker thread scanning the roots # (globals, registers, thread stacks and VM data structures). [Ext Root Scanning (ms): Min: 0.2, Avg: 0.4, Max: 0.7, Diff: 0.5, Sum: 1.7] # Update RS gives us the time each thread spent in updating the Remembered Sets. [Update RS (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0] ...

2.4 GC日志文件分析工具
2.4.1 gceasy
官网:https://gceasy.io可以比较不同的垃圾收集器的吞吐量和停顿时间
比如打开cms-gc.log和g1-gc.log


2.4.2 GCViewer
吞吐量:Throughput

停顿时间:Max/Min/Avg Pause

2.5 G1调优与最佳指南
2.5.1 调优
是否选用G1垃圾收集器的判断依据
https://docs.oracle.com/javase/8/docs/technotes/guides/vm/G1.html#use_cases
(1)50%以上的堆被存活对象占用 (2)对象分配和晋升的速度变化非常大 (3)垃圾回收时间比较长
思考:https://blogs.oracle.com/poonam/increased-heap-usage-with-g1-gc
使用G1GC垃圾收集器:
-XX:+UseG1GC修改配置参数,获取到gc日志,使用GCViewer分析吞吐量和响应时间
Throughput Min Pause Max Pause Avg Pause GC count 99.16% 0.00016s 0.0137s 0.00559s 12调整内存大小再获取gc日志分析
-XX:MetaspaceSize=100M -Xms300M -Xmx300M比如设置堆内存的大小,获取到gc日志,使用 GCViewer 分析吞吐量和响应时间
Throughput Min Pause Max Pause Avg Pause GC count 98.89% 0.00021s 0.01531s 0.00538s 12调整最大停顿时间
-XX:MaxGCPauseMillis=20 设置最大GC停顿时间指标比如设置最大停顿时间,获取到gc日志,使用 GCViewer 分析吞吐量和响应时间
Throughput Min Pause Max Pause Avg Pause GC count 98.96% 0.00015s 0.01737s 0.00574s 12启动并发GC时堆内存占用百分比
-XX:InitiatingHeapOccupancyPercent=45 G1用它来触发并发GC周期,基于整个堆的使用率,而不只是某一代内存的使用比例。值为 0 则表示“一直执行GC循环)'. 默认值为 45 (例如, 全部的 45% 或者使用了45%).比如设置该百分比参数,获取到gc日志,使用GCViewer分析吞吐量和响应时间
Throughput Min Pause Max Pause Avg Pause GC count 98.11% 0.00406s 0.00532s 0.00469s 12
2.5.2 最佳指南
官网建议:https://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc_tuning.html#recommendations
不要手动设置新生代和老年代的大小,只要设置整个堆的大小
G1收集器在运行过程中,会自己调整新生代和老年代的大小 其实是通过adapt代的大小来调整对象晋升的速度和年龄,从而达到为收集器设置的暂停时间目标 如果手动设置了大小就意味着放弃了G1的自动调优不断调优暂停时间目标
一般情况下这个值设置到100ms或者200ms都是可以的(不同情况下会不一样),但如果设置成50ms就不太合理。暂停时间设置的太短,就会导致出现G1跟不上垃圾产生的速度。最终退化成Full GC。所以对这个参数的调优是一个持续的过程,逐步调整到最佳状态。暂停时间只是一个目标,并不能总是得到满足。使用 -XX:ConcGCThreads=n 来增加标记线程的数量
IHOP如果阀值设置过高,可能会遇到转移失败的风险,比如对象进行转移时空间不足。如果阀值设置过低,就会使标记周期运行过于频繁,并且有可能混合收集期回收不到空间。 IHOP值如果设置合理,但是在并发周期时间过长时,可以尝试增加并发线程数,调高ConcGCThreads。MixedGC 调优
-XX:InitiatingHeapOccupancyPercent -XX:G1MixedGCLiveThresholdPercent -XX:G1MixedGCCountTarger -XX:G1OldCSetRegionThresholdPercent适当增加堆内存大小
3 高并发场景分析
以每秒3000笔订单为例

4 JVM性能优化指南

5 常见问题思考
- 内存泄漏与内存溢出的区别
内存泄漏:对象无法得到及时的回收,持续占用内存空间,从而造成内存空间的浪费。
内存溢出:内存泄漏到一定的程度就会导致内存溢出,但是内存溢出也有可能是大对象导致的。 - young gc 会有 stw 吗?
不管什么 GC,都会有 stop-the-world,只是发生时间的长短。 - major gc和full gc的区别
major gc 指的是老年代的gc,而 full gc等于young+old+metaspace的gc。 - G1与CMS的区别是什么
CMS 用于老年代的回收,而 G1 用于新生代和老年代的回收。
G1 使用了 Region 方式对堆内存进行了划分,且基于标记整理算法实现,整体减少了垃圾碎片的产生。 - 什么是直接内存
直接内存是在 java 堆外的、直接向系统申请的内存空间。通常访问直接内存的速度会优于Java堆。因此出于性能的考虑,读写频繁的场合可能会考虑使用直接内存。 - 不可达的对象一定要被回收吗?
即使在可达性分析法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑阶段”,要真正宣告一个对象死亡,至少要经历两次标记过程;可达性分析法中不可达的对象被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行 finalize 方法。当对象没有覆盖 finalize 方法,或 finalize 方法已经被虚 拟机调用过时,虚拟机将这两种情况视为没有必要执行。
被判定为需要执行的对象将会被放在一个队列中进行第二次标记,除非这个对象与引用链上的任何一个对象建立关联,否则就会被真的回收。 - 方法区中的无用类回收
方法区主要回收的是无用的类,那么如何判断一个类是无用的类的呢?
判定一个常量是否是“废弃常量”比较简单,而要判定一个类是否是“无用的类”的条件则相对苛刻许多。类需要同时满足下面 3 个条件才能算是 “无用的类” :- 该类所有的实例都已经被回收,也就是 Java 堆中不存在该类的任何实例。
- 加载该类的 ClassLoader 已经被回收。
- 该类对应的 java.lang.Class 对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
虚拟机可以对满足上述 3 个条件的无用类进行回收,这里说的仅仅是“可以”,而并不是和对象一样不使用了就会必然被回收。
- 不同的引用
JDK1.2以后,Java对引用进行了扩充:强引用、软引用、弱引用和虚引用