又抓了一个导致频繁GC的鬼--数组动态扩容

概述

本周有个同事过来咨询一个比较诡异的又抓gc问题,大概现象是个导鬼数,系统一直在做cms gc,致频组动但是态扩老生代一直不降下去,但是又抓执行一次jmap -histo:live之后,也就是个导鬼数主动触发一次full gc之后,通过jstat -gcutil来看老生代一下就降下去了,致频组动初看下理论上不太可能,态扩因为full gc也会对old做回收,又抓于是个导鬼数我要同事针对他们的场景写了一个简单的demo出来,然后果然还真能重现,致频组动不过他的态扩demo设置的Heap有32G,于是又抓我通过慢慢调整,最终在很小的个导鬼数内存下也能重现出来。

Demo

测试代码如下:

正如我上面注释里写的致频组动JVM参数,控制新生代200M,老生代300M,老生代使用率达到90%的时候触发CMS GC,大家可以跑跑看,这种情况下会发现不断做CMS GC,站群服务器但是老生代就是不降下去,但是只要你主动触发一次Full GC,老生代立马就会回收。

当allocateMemory方法执行完之后,期待的结果是gc之后List及里面的byte数组都应该被回收掉,可是事实并不是这样的。

初步定位

这段代码非常简单,我翻来覆去地看着这段代码,视图想改变点什么,能让问题出现峰回路转,我不断地控制for循环的次数和每次分配的内存大小,最终我将目标转移到那个ArrayList上,List里有个数组,在add过程中如果发现数组不够了,于是会进行扩容,那扩容就是创建新的数组,将老的对象放到新数组里,那我试想要是云南idc服务商不做扩容会不会有问题?于是我开始调整ArrayList的初始化大小,当我调到一定大小,保证在add过程中不会做扩容,问题真出现了反转,居然能正常回收了,比如上面的demo,将数组长度设置为len,那结果就完全不一样了,老生代很快就被回收了。

那目标能锁定到数组扩容了

数组扩容

ArrayList里的数组扩容,使用的是System.arrayCopy调用,这是一个native方法,在java层面创建一个新的长度的数组,然后将老数组和新数组都传进去,在native里将老数组里的元素指针拷贝到新数组里,其实做的是浅拷贝,反复看native这块实现,也基本解释不通那个现象,一度怀疑我对GC的理解了,是服务器托管不是有哪些细节没有注意到。

经过我内存dump分析,发现上面Demo里的List对象确实被回收了,但是List里的数组没有被回收,这个数组里的byte数组都没有被回收。

原来是这个鬼

带着百思不得其解的疑惑和我们组同事讨论,看看还有没有其他可能的没考虑到疑惑点,开始也都觉得疑惑,后来传胜突然想到会不会是存在跨代引用的问题,于是回过来仔细再想想每个步骤,好像还真有可能,因为传给System.arrayCopy的新数组是在java层面构建传进来的,在新生代分配的可能性***,这样再加上拷贝仅仅是浅拷贝,那么老生代里的byte数组因为存在新生代里新书组的引用,那仅仅做CMS GC就不可能回收这些老生代的对象了,因为CMS GC的一个gc root就是新生代里的对象。

那何解

至此终于抓出了那个鬼,于是想应对策略,既然这样,只要保证在cms gc回收old之前做一次ygc就能保证新生代里的那个新数组被回收而没有指向老生代那些byte数组,那么这些数组就能正常被cms gc回收了,所以加上-XX:+CMSScavengeBeforeRemark即可解此问题。

【本文是专栏作者李嘉鹏的原创文章,转载请通过微信公众号(你假笨,id:lovestblog)联系作者本人获取授权】

戳这里,看该作者更多好文

人工智能
上一篇:为什么说注册域名注意细节?哪些我们不能忽视?
下一篇:只要我们做的是从目前的市场情况选择域名,从简单易记,从个性特征上,我们就可以找到一个好域名进行注册。域名注册进行域名记录和解析以及绑定网站后,客户可以通过URL登录您的网站。