java代码可达性分析,可达性模型分析

可达性分析算法及4种引用说明

哪些对象可以被回收 彻底失去引用的对象  GC roots 可达性分析算法 可以判断 没有引用链的就可以被回收。这算第一次标记。第二次标记成功后会被回收。

马龙ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为成都创新互联的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:18982081108(备注:SSL证书合作)期待与您的合作!

对象在内存中的状态:

可达状态:

可恢复状态:

不可达状态:

             

判断对象是否存活都与引用有关,下面介绍一下引用的分类:

引用分类:

强引用;Object obj = new Object()

软引用;notmust

弱引用;

虚引用;

数组、对象

类似:Object obj = new Object()

只要存在强引用,垃圾收集器永远不会回收掉被引用的对象

描述一些还有用但并非必须的对象。在系统将要发生内存溢出异常之前,将会把这些对象列入回收范围之中进行第二次回收。如果这次回收之后还没有足够的内存——抛出内存异常

内存充足,不会回收

内存不足,回收

非必需对象

垃圾回收机制运行时,不管内存充足与否,都会回收

不能单独存在,必须和引用队列联合使用。

无法通过虚引用来去的一个对象实例。

对象存活判定算法:

引用计数算法:

思路:

给对象添加一个引用计数器,每当一个地方引用它时,计数器加1;

当引用失效时,计数器值就减1;

任何时刻计数器为0的对象就是不能再被使用的。

缺点:

很难解决对象之间相互循环引用的问题。导致他们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收他们。

思路:

通过一系列的成为“GC Roots”的对象作为起始点,

从这些节点开始向下搜索,搜索所走过的路径成为引用链(Reference Chain),

当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。

应用:

现在主流的商用程序语言(java,C#)都是通过可达性分析来判断对象是否存活的。

Java中,可作为GC Roots的对象包括:

虚拟机栈(栈帧中的本地变量表)中引用的对象;

方法区中类静态属性引用的对象;

方法区中常量引用的对象;

本地方法栈中JNI(即Native方法)引用的对象;

对象死亡(被回收)前的最后一次挣扎

  即使在可达性分析算法中不可达的对象,也并非是“非死不可”,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程。

  第一次标记:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记;

  第二次标记:第一次标记后接着会进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。在finalize()方法中没有重新与引用链建立关联关系的,将被进行第二次标记。

  第二次标记成功的对象将真的会被回收,如果对象在finalize()方法中重新与引用链建立了关联关系,那么将会逃离本次回收,继续存活。

收集器 

浅谈CMS垃圾收集器与G1收集器

Java之美[从菜鸟到高手演变]之JVM内存管理及垃圾回收

jdk8:垃圾回收算法

怎么验证java的gc是否会回收了某个不用的对象了。我有段代码有性能问题,需要调优,想知道怎么看

1. 引用计数器算法

解释

系统给每个对象添加一个引用计数器,每当有一个地方引用这个对象的时候,计数器就加1,当引用失效的时候,计数器就减1,在任何一个时刻计数器为0的对象就是不可能被使用的对象,因为没有任何地方持有这个引用,这时这个对象就被视为内存垃圾,等待被虚拟机回收

优点

客观的说,引用计数器算法,他的实现很简单,判定的效率很高,在大部分情况下这都是相当不错的算法

其实,很多案例中都使用了这种算法,比如 IOS 的Object-C , 微软的COM技术(用于给window开发驱动,.net里面的技术几乎都是建立在COM上的),Python语言等.

缺陷

无法解决循环引用的问题.

这就好像是悬崖边的人采集草药的人, 想要活下去就必须要有一根绳子绑在悬崖上. 如果有两个人, 甲的手拉着悬崖, 乙的手拉着甲, 那么这两个人都能活, 但是, 如果甲的手拉着乙, 乙的手也拉着甲, 虽然这两个人都认为自己被别人拉着, 但是一样会掉下悬崖.

比如说 A对象的一个属性引用B,B对象的一个属性同时引用A A.b = B() B.a = A(); 这个A,B对象的计数器都是1,可是,如果没有其他任何地方引用A,B对象的时候,A,B对象其实在系统中是无法发挥任何作用的,既然无法发挥作用,那就应该被视作内存垃圾予以清理掉,可是因为此时A,B的计数器的值都是1,虚拟机就无法回收A,B对象,这样就会造成内存浪费,这在计算机系统中是不可容忍的.

解决办法

在语言层面处理, 例如Object-C 就使用强弱引用类型来解决问题.强引用计数器加1 ,弱引用不增加

Java中也有强弱引用

2. 可达性分析算法

解释

这种算法通过一系列成为 "GC Roots " 的对象作为起始点,从这些节点开始向下搜索所有走过的路径成为引用链(Reference Chain) , 当一个对象GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达),则证明此对象是不可用的

优点

这个算法可以轻松的解决循环引用的问题

大部分的主流java虚拟机使用的都是这种算法

3. Java语言中的GC Roots

在虚拟机栈(其实是栈帧中的本地变量表)中引用的对象

在方法区中的类静态属性引用对象

在方法区中的常量引用的对象

在本地方法栈中JNI(即一般说的Native方法)的引用对象

可达性分析起始点未定位原因

相对于引用计数算法而言,可达性分析算法不仅同样具备实现简单和执行高效等特点,更重要的是该算法可以有效解决引用计数算法中循环引用的问题,防止内存泄漏的发生

java选择的就是可达性分析算法,这种类型的垃圾收集通常也叫做追踪性垃圾收集

所谓GC ROOTS 根集合就是一组必须活跃的引用

基本思路:

1.可达性分析算法是以根对象集合(GC Roots)为起始点,按照从上至下的方式搜索被根对象集合所连接的目标对象是否可达

2.使用可达性分析算法后,内存中的存活对象都会被根对象集合直接或间接连接着,搜索所走过的路径称为引用链

3.如果目标对象没有任何引用链项链,则是不可达的,就意味着该对象已经死亡,可以标记为垃圾对象

4.在可达性分析算法中,只有能够被根对象集合直接或者间接连接的对象才是存活对象

JVM并发的可达性分析

j当面试扯到jvm这一部分的时候,面试官大概率会问你 jvm怎么判断哪些对象应该回收呢 ?

你会脱口而出 引用计数算法 和 可达性分析算法 。

引用计数法: 在对象中添加一个引用计数器,每当一个地方引用它时,计数器就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。

但是这样的算法有一个问题?

就是不能解决循环依赖的问题。

可达性分析算法的思路 就是通过一系列的“GC Roots”,也就是根对象作为起始节点,从根节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为引用链,如果某个对象到GC Roots间没有任何引用链相连。就是说从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的,是可以被回收的对象。

接下来面试官可能会问:

你刚刚谈到了根节点,那你知道哪些对象可以作为根对象吗?

你刚刚谈到了引用,那你知道java里面有哪几种引用吗?

你刚刚谈到了可达性分析算法,那如果在该算法中被判定不可达对象,是不是一定会被回收呢?

(这这些问题,文末会给出解答)

这些问题太常规了,本文要讲一些不那么常见的: 并发标记 , 浮动垃圾 。

CMS和G1都有一个并发标记的过程,并发标记要解决什么问题?带来了什么问题?怎么解决这些问题呢?

刚刚我们谈到的可达性分析算法是需要一个理论上的前提的: 该算法的全过程都需要基于一个能保障一致性的快照才能够分析,这意味着必须全程冻结用户线程的运行。 而为了不冻结用户线程的运行,那我们就需要让垃圾回收线程和用户线程同时运行。

那我们先假设不并发标记,即只有垃圾回收线程在运行的流程是怎样的:

第一步:找到根节点,也就是我们常说的 根节点枚举 。

在这个过程中,由于GC Roots是远远小与整个java堆中的全部对象,而且在OopMap此类优化技巧的加持下,它带来的停顿是非常短暂且固定的, 可以理解为不会随着堆里的对象的增加而增加 ,如图:

首先我们要搞清楚一个问题: 为什么遍历对象图的时候必须在一个能保证一致性的快照中?

为了说明这个问题,我们引入 “三色标记” 方法。

什么是“三色标记”?

在遍历对象图的过程中,把访问的对象按照"是否访问过"这个条件标记成以下三种颜色:

白色:表示对象未被垃圾回收器访问过 。

显然可达性分析刚开始的时候,所有的对象都是白色,若在结束的时候,仍是白色的对象,即代表不可达。

黑色:表示已经被垃圾回收器访问过,且这个对象的所有引用都已经扫描过

黑色的对象代表已经扫描过,它是安全存活的,如果有其它的对象引用指向了黑色对象,无须重新扫描一遍。黑色对象不可能直接(不经过灰色对象)指向某个白色对象。

灰色:表示已经被垃圾回收器扫描过,但这个对象至少存在一个引用还没有被扫描 。

如下图所示:

我们先看一下正常标记的过程:

首先是初始状态,很简单,只有GC Roots是黑色的。同时需要注意下面的图片的箭头方向,代表的是有向的,比如其中的一条引用链是:

跟节点-5-6-7-8-11-10

如果在标记的过程中,用户线程修改了引用关系,就会出现下面的情况:

有一个大佬叫Wilson,他在1994年在理论上证明了, 只有同时满足以下两个条件时 ,会产生“对象消失”的问题,原来应该是黑色的对象被标记成了白色。

增量更新要破坏的是第一个条件(赋值器插入了一条或者多条从黑色对象到白色对象的新引用),当黑色对象插入新的指向白色对象的引用关系时,就将这个新插入的引用 记录下来 ,等并发扫描结束之后,再以这些记录过的引用关系中的黑色对象为根, 重新扫描一次 。

可以简化的理解为: 黑色对象一旦插入了指向白色对象的引用之后,它就变回了灰色对象 。

下面的图就是一次并发扫描结束之后,记录了黑色对象5新指向了白色对象9:

原始快照要破坏的是第二个条件(赋值器删除了全部从灰色对象到该白色对象的直接或间接引用),当灰色对象要删除指向白色对象的引用关系时,就将这个要删除的引用记录下来,在并发扫描结束之后,再以这些记录过的引用关系中的灰色对象为根,重新扫描一次。

可以简化理解为:无论引用关系删除与否,都会按照刚刚开始扫描那一刻的对象图快照开进行搜索。

接下来回答一下,上面遗留的几个问题:

GC管理的主要区域是Java堆,一般情况下只针对堆进行垃圾回收。方法区、栈和本地方法区不被GC所管理,因而选择这些区域内的对象作为GC Roots,被GC Roots引用的对象不被GC回收。

Class - 由系统类加载器(system class loader)加载的对象,这些类是不能够被回收的,他们可以以静态字段的方式保存持有其它对象。

Thread - 活着的线程

Stack Local - Java方法的local变量或者参数

JNI Local、JNI Global

Monitor Used - 用于同步的监控对象

在Java语言里,可以作为GC Roots对象的包括如下几种:

你知道java里面有哪几种引用吗?

在可达性分析算法判定为不可达的对象,是不是一定会被回收呢?

即使在可达性算法中不可达的对象也不一定是非死不可的,这时候它们暂时处于“缓刑”阶段,要真正宣告它的死亡还需要经历两次的标记阶段。

第一次标记

在对象可达性算法不可达时,进行第一次标记,并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize方法或者该方法被虚拟机调用过,虚拟机将这两种情况视为“没有必要去执行”,回收。

如果该对象被判定为有必要执行finalize()方法,那么这个对象会被放置到一个叫做F-Queue的队列中,并在稍后由一个虚拟机自动建立的、低优先级的Finalize线程去执行它。这里所谓的执行就是去触发该方法,但是并不会承诺等待它执行结束,这样做的原因是,如果对象在finalize()方法中执行缓慢,或者发生死循环,将会导致整个队列中的对象处于等待之中。

第二次标记

finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中拯救自己——只要重新与引用链上的一个对象重新建立关联即可,比如将自己(this关键字)赋值给某个类变量或者成员变量,那么在第二次标记的时候就会被移除“即将回收”的集合;如果对象这时候还没有逃脱,那么就会被真的回收了。

注意:第二次自救失败是因为任何一个对象的finalize()方法只能执行一次,如果第二次回收,就不会执行finalize方法了!

(未完待续)

Java可达性分析算法会不会出现循环引用问题

GC Root在对象图之外,是特别定义的“起点”,不可能被对象图内的对象所引用。

一个常见的误解是以为GC Root是一组对象。

实际情况是GC Root通常是一组特别管理的指针,这些指针是tracing GC的trace的起点。它们不是对象图里的对象,对象也不可能引用到这些“外部”的指针,所以题主想像的情况无法成立。

另外,tracing GC能正确处理循环引用,保证每个活对象只会被访问一次就能确定其存活性。对象图里是否存在循环引用,tracing GC都能正确判断对象的存活与否。


网站名称:java代码可达性分析,可达性模型分析
标题URL:http://myzitong.com/article/hedcgg.html