JVM(java虚拟机 详解三个主要的话题:1.JVM 中的内存区域划分2.JVM 的类加载机制3.JVM 中的垃圾回收算法)

发布于:2024-04-25 ⋅ 阅读:(30) ⋅ 点赞:(0)

jdk  java开发工具包

jre  java运行时环境

jvm java虚拟机

JDK、JRE、JVM之间的关系?
JDK(Java Development Kit):Java开发工具包,提供给Java程序员使用,包含了JRE,同时还包含了编译器javac与自带的调试工具Jconsole、jstack等。
JRE(Java Runtime Environment):Java运行时环境,包含了JVM,Java基础类库。是使用Java语言编写程序运行的所需环境。
JVM:Java虚拟机,运行Java代码

java语言的顺序:

1.使用记事本或者IDEA(集成开发环境)编写Java源程序
2.使用javac.exe编译器编译Java源程序,生成xxx.class的字节码文件 语法格式:javac xxx.java

3.使用java运行xxx.class字节码文件 语法格式:java xxx

因此, 我们编写和发布一个 java 程序,其实就只要发布 .class 文件即可jvm 拿到 .class 文件,就知道该如何转换.windows 上的 jvm 就可以把 .class 转成 windows 上能支持的可执行指令了linux 上的 jvm 就可以把 .class 转成 linux 上可以支持的可执行指令了!

三个主要的话题:

1.JVM 中的内存区域划分
2.JVM 的类加载机制
3.JVM 中的垃圾回收算法


JVM 中的内存区域划分

JVM其实也是进程

在任务管理器中可以看到

进程运行的前期,需要向系统申请一些资源(内存就是其中典型的资源)

这些内存就支撑了后续的java程序的执行.

比如:在java中定义变量所消耗的内存,就是jvm从系统中申请的内存.

jvm从系统中要了一些内存之后,又会根据实际的内存来分批不同的空间来存放不同的数据.(这个就是区域划分).

此处谈到的堆和栈和数据结构中谈到的堆和栈是不同的.

堆:

代码中new出来的对象都是在这里,对象中持有的非静态变量也在这里.

栈:

1.本地方法栈:jvm内部通过c++写的底层逻辑,调用关系和局部变量(一般不会谈到这,说到栈都是说的是栈的虚拟机栈)

2.虚拟机栈:记录了java中方法的调用关系,java代码的局部变量.

每个线程都有自己的栈和计数器

程序计数器:

这个区域比较小的空间,专门存储下一条java指令要执行的地址.(每个线程都有自己的程序计数器和栈)

元数据区(以前java中叫做方法区,从1.8开始改名字):

指的是一些有辅助性质的,描述性质的属性.

咱们写的 java 代码, if, while, for, 各种逻辑运算..这些操作最终都会被转换成 java 字节码
(javac 就会完成上述代码=>字节码)
此时这些字节码在程序运行的时候就会被jvm 加载到内存中放到 元数据区(方法区) 里头
此时,当前程序要如何执行,要做哪些事情,就会按照上述元数据区里记录的字节码依次执行了.

就类似硬盘一样


JVM的类加载机制

类加载大体的过程可以分成5 个步骤(也有资料上说是 3 个,这个情况就是把 2,3,4 合并成一个了)

1.加载

把硬盘上的.class文件找到,然后打开文件,然后读取文件内容.(认为读到的是二进制数据)

2.验证

需要验证当前内容是合法的,是.class(字节码文件)格式

3.给类对象申请空间

此处申请的内存空间.值都是默认0

4.解析

主要是针对字符串常量处理.

解析阶段是java虚拟机将常量池内的符号转换为直接引用的过程,也就是初始化常量的过程

将符号偏移量转换为直接引用hello的地址就是解析

5.初始化

还要执行静态代码块的逻辑.还可能触发父类的加载.


加载环节(双亲委派模型):描述了如何查找.class的文件策略.

JVM 中进行类加载的操作,是有一个专门的模块,称为"类加载器"(ClassLoader)JM 中的类加载器默认是有 三个 的.(也可以自定义)

上述这三个类型存在父子关系.从下到上.

双亲委派模型工作过程:
1.从 ApplicationClassLoader 作为入口,先开始工作
2.ApplicationClassLoader 不会立即搜索自己负责的目录会把搜索的任务交给自己的父亲,
3.代码就进入到 ExtensionClassLoader 范畴了ExtensionClassLoader 也不会立即搜索自己负责的目录也要把搜索的任务交给自己的父亲
代码就进入到 BootstrapClassLoader 范時了BootstrapClassLoader 也不想立即搜索自己负责的目录也要把搜索的任务交给自己的父亲
5. BootstrapClassLoader 发现自己没有父亲才会真正搜索负责的目录(标准库目录)
通过全限定类名,尝试在标准库目录中找到符合要求的 .class 文件
如果找到了,接下来就直接进入到打开文件/读文件等流程中,如果没找到,回到孩子这一辈的类加载器中,继续尝试加载,
6.ExtensionClassLoader 收到父亲交回给他的任务之后,
自己进行搜索负责目录(扩展库的目录)
如果找到了,接下来进入到后续流程.
如果没找到,也是回到孩子这一辈的类加载器中继续尝试加载,
7.ApplicationClassLoader 收到父亲交回给他的任务之后自己进行搜索负责的目录(当前项目目录/第三方库目录)
如果找到了,接下来进入后续流程.
如果没找到,也是回到孩子这一辈的类加载器中继续尝试加载.由于默认情况下 ApplicationClassLoader 没有孩子了,此时说明类加载过程失败了!就会抛出 ClassNotFoundException 异常

JVM垃圾回收机制(GC)

c++就没有这样的机制,不是因为这个机制很难实现,而是因为这个东西会额外的付出系统开销.影响程序的执行性能.

java发展多年,可以把垃圾回收处理控制在1ms内.一个请求或者接受时间一般是几ms到几十ms.

如果一个引用没有任何指向,就说明所有的指向都结束了,就是荒废的引用.就可以进行回收了.

如果代码比较复杂,这样就解决不了了,就有了以下两中办法:

1.引用计数

这种方法没有在java中使用,但是在别的语言中广泛使用(比如python,PHP等等)

给每个对象安排一个小空间,用来记录当前对象有几个引用.

2.可达性分析(JVM用的是这个)

本质上是用"时间 换 空间”相比于引用计数,需要消耗更多的额外的时间, 但是总体来说,还是可控的.
不会产生类似于"循环引用"这样的问题.
在写代码的过程中,会定义很多的变量.
比如,栈上的局部变量/方法区中的静态类型的变量/常量池中引用的对象!....
就可以从这些变量作为起点,出发,尝试去进行"遍历"所谓的遍历就是会沿着这些变量中持有的引用类型的成员,再进一步的往下进行访问...
所有能被访问到的对象,自然就不是垃圾了.剩下的遍历一圈也访问不到的对象,自然就是垃圾~~


识别出垃圾以后,还需要释放垃圾:

主要的释放方式有三种:

a.标记-清除(一般不会用这个方法,因为内存碎片问题,比较致命)

比如黑色的就是垃圾,此时我们直接释放,就会产生很多小的内存碎片,就会导致后续的内存申请失败

因为内存申请是一片连续的空间.

b.复制算法

c.标记-整理

类似于顺序表删除中间元素.(搬运)


分代回收(依据不同种类的对象,采取不同的方式)
引入概念, 对象的年龄,
JM 中有专门的线程负责周期性扫描/释放,一个对象,如果被线程扫描了一次,可达了(不是垃圾),年龄就 +1(初始年龄相当于是 0)
JVM 中就会根据对象年龄的差异,把整个堆内存分成两个大的部分新生代(年龄小的对象)/ 老年代(年龄大的对象)

1)当代码中 new 出一个新的对象,这个对象就是被创建在伊甸区的.伊甸区中就会有很多的对象
.个经验规律: 伊甸区中的对象,大部分是活不过第一轮 GC这些对象都是"朝生夕死”,生命周期非常短!!

2)第一轮 GC 扫描完成之后,少数伊甸区中幸存的对象, 就会通过复制算法, 拷贝到 生存区后续 GC 的扫描线程还会持续进行扫描,不仅要扫描伊甸区,也要扫描生存区的对象.生存区中的大部分对象也会在扫描中被标记为垃圾.少数存活的,就会继续使用复制算法,拷贝到另外一个生存区中!!只要这个对象能够在生存区中继续存活,就会被复制算法继续拷贝到另一半的生存区中.每次经历一轮 GC 的扫描,对象的年龄都会 +1

3)如果这个对象在生存区中,经过了若干轮 GC 仍然健在~~JVM 就会认为,这个对象生命周期大概率很长, 就把这个对象从生存区,拷贝到老年代~~


4)老年代的对象,当然也要被 GC 扫描,但是扫描的频次就会大大降低了
老年代的对象,要 G 早 G 了~~ 既然没 G 说明生命周期应该是很长的,频繁 GC 扫描意义也不大,白白浪费时间.不如放到老年代,降低扫描频率,


5)对象在老年代寿终正寝,此时 JM 就会按照标记整理的方式,释放内存!

Java的分代回收机制是一种垃圾回收策略,它将堆内存分为不同的代,分别是年轻代(Young Generation)、老年代(Old Generation)和永久代(Permanent Generation)。

  1. 年轻代:年轻代是新创建的对象的存放区域,它又被分为Eden区和两个Survivor区(通常是一个From区和一个To区)。当对象被创建时,它们首先被分配到Eden区。当Eden区满时,会触发一次Minor GC(年轻代垃圾回收),将仍然存活的对象复制到其中一个Survivor区,同时清空Eden区和另一个Survivor区。经过多次Minor GC后,仍然存活的对象会被移到老年代。

  2. 老年代:老年代主要存放生命周期较长的对象。当老年代空间不足时,会触发一次Major GC(全局垃圾回收),对整个堆进行垃圾回收。Major GC的频率相对较低,因为老年代的对象生命周期较长。

  3. 永久代:永久代主要用于存放类的元数据、常量池等信息。在Java 8及以后的版本中,永久代被元空间(Metaspace)所取代。

分代回收机制的优势在于根据对象的生命周期将堆内存划分为不同的区域,针对不同区域采用不同的垃圾回收算法,从而提高垃圾回收的效率。年轻代中的Minor GC频繁进行,可以快速回收短生命周期的对象,而老年代中的Major GC相对较少,减少了全局垃圾回收的开销。