JVM的内存模型

1. 概述

Java虚拟机在执行java程序的过程中,会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户线程的启动和结束而建立和销毁。

java虚拟机所管理的内存包括以下几个运行时数据区域:

  • 方法区(包括运行时常量池):存储类信息、常量、静态变量、即时编译器编译后的代码等;各种字面量和符号引用。

  • Java堆:存储java对象。

  • Java栈:存储方法以及方法中的存储局部变量表(存放基本数据类型和引用类型)、操作数栈、动态链接、方法出口等信息。

  • 本地方法栈:和虚拟机栈类似,只不过存储的是native方法。

  • 程序计数器:存储当前线程执行的字节码的行号。

其中属于所有线程共享的数据区是:方法区、堆;

属于线程隔离(线程安全)的数据区是:Java栈、本地方法栈、程序计数器。

2. Java堆

对大多数应用来说,Java堆是JVM管理的内存中最大的一块。在虚拟机启动时创建,唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。

Java堆是垃圾收集器管理的主要区域,因此很多时候也叫GC堆。从内存回收的角度看,由于现在收集器基本都是采用分代收集算法,所以Java堆还可以细分为:新生代和老年代。再细致一点的话新生代可以分为Eden空间、From Survivor空间、To Survivor空间。

如果在java堆中没有完成实例分配,并且堆也无法拓展时,将会抛出OutOfMemoryError异常。

  1. Java进程启动时,虚拟机就会分配一块初始堆空间,可以使用参数-Xms指定这块空间的大小;

  2. 如果初始堆空间耗尽,虚拟机会对堆空间继续扩展,其扩展上限为最大堆空间,最大堆空间可以使用参数-Xmx指定;

3. 方法区

方法区用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然java虚拟机规范将方法区描述为一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的是与java堆区分开来。

当该方法区无法满足内存分配需求时,将抛出OutOfMemoryError错误。

运行时常量池

运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容在JVM类加载后进入方法区的运行时常量池中存放。也会抛出OutOfMemoryError错误。

4. Java栈

也叫虚拟机栈,它的生命周期与线程相同,虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时会创建一个栈帧,栈帧是用于支持虚拟机进行方法调用和方法执行的数据结构,存储了局部变量表(存放基本数据类型和引用类型)、操作数栈、动态链接、方法出口等信息。每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。平时所说的堆内存、栈内存中的栈内存就是虚拟机栈。

当线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverFlowError异常;如果虚拟机栈可以动态扩展(大部分虚拟机都支持动态扩展,只不过虚拟机规范也允许固定长度的虚拟机栈),如果拓展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

栈帧结构如下:

下面讲讲栈帧结构里面局部变量表、操作数栈、动态链接和方法出口的作用:

4.1 局部变量表

局部变量表示一组变量值存储空间,用于存放方法参数和方法内定义的变量(局部变量)。在java程序被编译为class文件时,就在方法的Code属性的max_locals数据项中确定了该方法所需分配的局部变量表的最大容量。局部变量表的容量以槽(Slot)为最小单位。

4.2 操作数栈

操作数栈也叫操作栈,同局部变量表一样,在编译的时候操作数栈的最大深度写入到Code属性的max_stacks中。当方法刚开始执行的时候,操作数栈是空的,方法执行过程中,会有各种字节码指令往操作数栈中写入和提取内容,也就是入栈/出栈的操作。例如在做运算的时候就是通过操作数栈来进行的,又或者在调用其他方法的时候也是通过操作数栈来进行参数传递的。

在概念模型中,两个栈帧作为虚拟机栈的元素,是互相独立的,但在大多虚拟机的实现里都会做一些优化处理,令两个栈帧出现一部分重叠,比如下面栈帧的部分操作数栈和上面栈帧的局部变量表重叠在一起,这样在进行方法调用的时候就可以共用一部分数据,无需进行额外的参数复制传递。

4.3 动态连接

每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。在Class文件的常量池中存在大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用作为参数。这些符号引用一部分会在类加载阶段或者第一次使用的时候就转化为直接引用,这种转化称为静态解析。另外一部分将在每一次运行期间转化为直接引用,这部分称为动态连接。

4.4 方法返回地址

当一个方法开始执行后,只有两种方式可以退出这个方法:

  • 正常完成出口:执行引擎遇到方法返回的字节码指令,这个时候可能会有返回值传递给上一层调用者;

  • 异常完成出口:在方法执行中遇到了异常,且这个异常没有在方法内得到处理,不会给生成调用者任何返回值。

无论采用何种方式退出,都会返回到方法调用的位置,方法返回时可能需要在栈帧中保存一些信息,用来帮助恢复它的上层方法的执行状态。方法退出即出栈可能执行的操作有:恢复上层方法的局部变量表和操作数栈,把返回值压入调用者栈帧的操作数栈中,调整PC计数器的值以指向方法调用指令后面的一条指令等。

5. 本地方法栈

和虚拟机栈类似,区别就是本地方法栈为虚拟机使用的Native方法服务,与虚拟机栈一样,也会抛出OutOfMemoryError和StackOverFlowError异常。

6. 程序计数器

这是一块较小的内存,它可以看做是当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变这个计数器来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器完成。

如果线程正在执行一个java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是native方法,这个计数器则为空。

此内存区域是唯一一个java虚拟机规范里面没有规定任何OutOfMemoryError情况的区域。

7. 直接内存

直接内存并不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域。但是这部分内存也被频繁的使用,而且也可能导致OutOfMemoryError异常出现。所以放在这里一起讲解。

在NIO中会使用直接内存。

本机直接内存分分配不会受到java堆大小的限制,但是会受到本机总内存和处理器寻址空间的限制。一般配置-Xmx等参数信息经常忽略直接内存,使得内存区域总和大于物理内存限制,从而导致动态扩展时出现OutOfMemoryError异常。

8. 补充

新生代:

一个对象新建一般在新生代,经过几轮GC,如果还存活的话就移动到老年代。hotspot将新生代划分为一个eden区和两个survivor区。每一次新生代gc时候。只用到一个eden区,一个survivor区。新生代一般的gc策略为复制算法。

老年代:

当新生代中的对象经过若干轮gc后还存活/或survisor在gc内存不够的时候,会把当前对象移动到老年代。大对象也会直接进去老年代。老年代一般gc策略为标记-整理算法。

永久代:

永久代是Hotspot虚拟机特有的概念,是方法区的一种实现。永久代保存的是一些代码/常量数据/类信息。永久代不是java堆内存的一部分,永久代存放JVM运行时使用的类,永久代的对象在full GC的时候进行垃圾回收。

参考:《深入理解Java虚拟机》— 周志明

Last updated