Appearance
概述
完整图如下:
如果自己想手写一个 Java 虚拟机的话,主要考虑哪些结构呢?
- 类加载器
- 执行引擎
类加载器子系统作用
类加载器子系统负责从文件系统或者网络中加载 Class 文件,Class 文件在文件开头有特定的文件标识。
ClassLoader 只负责 Class 文件的加载,至于它是否可以运行,则由 Execution Engine 决定。
举例:父母负责找人相亲,至于是否相亲成功,看个人的运行处理🤣。
加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是 Class 文件中常量池部分的内存映射)
- class file 存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到 JVM 当中来根据这个文件实例化出 n 个一模一样的实例
- class file 加载到 JVM 中,被称为 DNA 元数据模板,放在方法区
- 在 .class 文件 -> JVM -> 最终成为元数据模板,此过程就要一个运输工具(类装载器 Class Loader),扮演一个快递员的角色
::: note
class 文件通过某一个 ClassLoader 生成属于自己的类,然后根据自己的类实例化出三个实例,三个实例可以通过 getClass()
获取自己的类,自己的类也可以通过 getClassLoader()
获取某一个 ClassLoader。
:::
类的加载过程
例如下面的一段简单的代码:
java
public class HelloLoader {
public static void main(String[] args) {
System.out.println("谢谢 ClassLoader 加载我...");
}
}
它的加载过程是怎么样的呢?
.class
文件先经过装载,如果文件不合法或被恶意修改,则抛出异常,否则就链接,初始化、调用 main()
方法,输出结果。
完整的流程图如下所示:
加载阶段
通过一个类的全限定名获取定义此类的二进制字节流。
将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
在内存中生成一个代表这个类的 java.lang.Class
对象,作为方法区这个类的各种数据的访问入口。
加载class文件的方式
- 从本地系统中直接加载
- 通过网络获取,典型场景:Web Applet
- 从 zip 压缩包中读取,成为日后 jar、war 格式的基础
- 运行时计算生成,使用最多的是:动态代理技术
- 由其他文件生成,典型场景:JSP 应用从专有数据库中提取 .class 文件,比较少见
- 从加密文件中获取,典型的防 Class 文件被反编译的保护措施
链接阶段
链接阶段分为三步:验证、准备、解析。如图所示:
验证 Verify
目的在于确保 Class 文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。
主要包括四种验证,文件格式验证,元数据验证,字节码验证,符号引用验证。
工具:Binary Viewer 查看
验证 Class 文件正确的开始因素就是看开头是否有 CA FE BA BE
(咖啡baby)。
如果出现不合法的字节码文件,那么将会验证不通过。
同时我们可以通过安装 IDEA 的插件 jclass
,来查看我们的 Class 文件。
安装完成后,我们编译完一个 Class 文件后,点击 view 即可显示我们安装的插件来查看字节码方法了。
准备 Prepare
为类变量分配内存并且设置该类变量的默认初始值,即零值。
java
public class HelloApp {
private static int a = 1; // 准备阶段为 0,在下个阶段,也就是初始化的时候才是 1
public static void main(String[] args) {
System.out.println(a);
}
}
上面的变量 a 在准备阶段(Prepare)会赋初始值,但不是 1,而是 0。什么时候是 1 呢?在初始化阶段(后面说到)。
这里不包含用 final
修饰的 static,因为 final
在编译的时候就会分配了,准备阶段会显式初始化。
这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到 Java 堆中。
解析 Resolve
将常量池内的符号引用转换为直接引用的过程。
事实上,解析操作往往会伴随着 JVM 在执行完初始化之后再执行。
符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java 虚拟机规范》的 Class 文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄,也就是引用类的地址。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的 CONSTANT Class info、CONSTANT Fieldref info、CONSTANT Methodref info 等
::: note
Java 有很多类,每个类都有自己的符号来表示,我们写的一个 java 文件最后用到了哪些类,Java 就会根据这些类对应的符号引用这些类。
:::
初始化阶段
首先看张图:
初始化阶段就是执行类型初始化方法 <clinit>
和 <inint>
的过程。
<inint>
是针对类的普通变量进行初始化,如int num = 10;
<clinit>
是针对类的静态变量进行初始化,如:static int num = 10;
类型初始化方法 <clinit>
,JVM 通过 Classload 进行类型加载时,如果在加载时需要进行类型初始化操作时,则会调用类型的初始化方法。类型初始化方法主要是对 static 变量进行初始化操作,对 static 域和 static 代码块初始化的逻辑全部封装在 <clinit>
方法中。
此方法不需定义,是 javac 编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。
- 也就是说,当我们代码中包含 static 变量的时候,就会有
clinit
方法
构造器方法中指令按语句在源文件中出现的顺序执行。
<clinit>
不同于类的构造器。(关联:构造器是虚拟机视角下的 <clinit>
,若该类具有父类,JVM 会保证子类的 <clinit>
执行前,父类的 <clinit>
已经执行完毕。)
- 任何一个类在声明后,都有生成一个构造器,默认是空参构造器,在
<init>
中
java
public class ClassInitTest {
private static int num = 1;
static {
num = 2;
number = 20;
System.out.println(num);
System.out.println(number); // 报错,非法的前向引用
}
private static int number = 10; // 因为链接阶段(linking)已经将所有的变量赋值为零值,所以位置在哪都可以
public static void main(String[] args) {
System.out.println(ClassInitTest.num); // 2
System.out.println(ClassInitTest.number); // 10
}
}
第 10 行的 number 赋值过程:
- 链接阶段(linking)的准备 Prepare 已经将所有的变量赋值为零值,所以位置在哪都可以
- 按上下顺序执行,在 static 里将 number 赋值为 20
- 最后来到第 10 行,将 number 赋值为 10
所以最终输出的是 10。
关于涉及到父类时候的变量赋值过程
java
public class ClinitTest1 {
static class Father {
public static int A = 1;
static {
A = 2;
}
}
static class Son extends Father {
public static int b = A;
}
public static void main(String[] args) {
System.out.println(Son.b); // 输出 2
}
}
我们输出结果为 2,也就是说首先加载 ClinitTest1 的时候,会找到 main 方法,然后执行 Son 的初始化,但是 Son 继承了 Father,因此还需要执行 Father 的初始化,同时将 A 赋值为 2。我们通过反编译得到 Father 的加载过程,首先我们看到原来的值被赋值成 1,然后又被赋值成 2,最后返回。
bash
iconst_1
putstatic #2 <com/kbt/java/chapter02/ClinitTest1$Father.A>
iconst_2
putstatic #2 <com/kbt/java/chapter02/ClinitTest1$Father.A>
return
虚拟机必须保证一个类的 <clinit>
方法在多线程下被同步加锁(只能一个线程访问,其他线程在外面排队等待)。
java
public class DeadThreadTest {
public static void main(String[] args) {
new Thread(() -> {
System.out.println(Thread.currentThread().getName() + "\t 线程t1开始");
new DeadThread();
}, "t1").start();
new Thread(() -> {
System.out.println(Thread.currentThread().getName() + "\t 线程t2开始");
new DeadThread();
}, "t2").start();
}
}
class DeadThread {
static {
if (true) {
System.out.println(Thread.currentThread().getName() + "\t 初始化当前类");
while(true) {
}
}
}
}
上面的代码,输出结果为
md
线程t1开始
线程t2开始
线程t2 初始化当前类
从上面可以看出初始化后,只能够执行一次初始化,这也就是同步加锁的过程。
什么时候初始化普通变量?
普通变量要和类一起初始化(<init>
方法里),也是在初始化阶段,初始化阶段如下:
- 首先,加载父类中的静态代码块和静态属性,按照静态代码块和静态属性在代码中从上到下出现的先后顺序加载
- 然后,加载子类中的静态代码块和静态属性,按照静态代码块和静态属性在代码中从上到下出现的先后顺序加载
- 其次,加载父类中的普通代码块和普通属性,按照普通代码块和普通属性在代码中从上到下出现的先后顺序加载
- 最后,加载子类中的普通代码块和普通属性,按照普通代码块和普通属性在代码中从上到下出现的先后顺序加载
类加载器的分类
JVM 支持两种类型的类加载器。分别为 引导类加载器(Bootstrap ClassLoader) 和 自定义类加载器(User-Defined ClassLoader)。
从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是 Java 虚拟机规范却没有这么定义,而是 将所有派生于抽象类 ClassLoader 的类加载器都划分为自定义类加载器。
无论类加载器的类型如何划分,在程序中我们最常见的类加载器始终只有 3 个,如下所示:
这里的四者之间是包含关系,不是上层和下层,也不是子系统的继承关系。
我们通过一个类,获取它不同的加载器
java
public class ClassLoaderTest {
public static void main(String[] args) {
// 获取系统类加载器
ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
System.out.println(systemClassLoader); // sun.misc.Launcher$AppClassLoader@18b4aac2
// 获取其上层的:引导类加载器
ClassLoader extClassLoader = systemClassLoader.getParent();
System.out.println(extClassLoader); // sun.misc.Launcher$ExtClassLoader@1b6d3586
// 试图获取根加载器
ClassLoader bootstrapClassLoader = extClassLoader.getParent();
System.out.println(bootstrapClassLoader); // null
// 获取自定义加载器,默认使用系统类加载器
ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
System.out.println(classLoader); // sun.misc.Launcher$AppClassLoader@18b4aac2
// 获取 String 类型的加载器
ClassLoader classLoader1 = String.class.getClassLoader();
System.out.println(classLoader1); // null
}
}
得到的结果,从结果可以看出引导类加载器无法直接通过代码获取,同时目前用户代码所使用的加载器为系统类加载器。同时我们通过获取 String 类型的加载器,发现是 null,那么说明 String 类型是通过引导类加载器进行加载的,也就是说 Java 的核心类库都是使用引导类加载器进行加载的。
代码输出:
java
sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@1540e19d
null
sun.misc.Launcher$AppClassLoader@18b4aac2
null
::: note
引导类加载器属于 Java 皇室成员使用,平民百姓只能使用自定义类加载器。
:::
启动类加载器(引导类加载器,Bootstrap ClassLoader)
- 这个类加载使用 C/C++ 语言实现的,嵌套在 JVM 内部
- 它用来加载 Java 的核心库(
JAVAHOME/jre/1ib/rt.jar、resources.jar
或sun.boot.class.path
路径下的内容),用于提供 JVM 自身需要的类 - 并不继承自 java.lang.ClassLoader,没有父加载器
- 加载扩展类和应用程序类加载器,并指定为他们的父类加载器
- 出于安全考虑,Bootstrap 启动类加载器只加载包名为 java、javax、sun 等开头的类
扩展类加载器(Extension ClassLoader)
- Java 语言编写,由
sun.misc.Launcher$ExtClassLoader
实现 - 派生于 ClassLoader 类
- 父类加载器为启动类加载器
- 从
java.ext.dirs
系统属性所指定的目录中加载类库,或从 JDK 的安装目录的jre/1ib/ext
子目录(扩展目录)下加载类库。如果用户创建的 JAR 放在此目录下,也会自动由扩展类加载器加载
应用程序类加载器(系统类加载器,AppClassLoader)
- Java 语言编写,由
sun.misc.LaunchersAppClassLoader
实现 - 派生于 ClassLoader 类
- 父类加载器为扩展类加载器
- 它负责加载环境变量 classpath 或系统属性
java.class.path
指定路径下的类库 - 该类加载是程序中默认的类加载器,一般来说,Java 应用的类都是由它来完成加载
- 通过
classLoader#getSystemclassLoader()
方法可以获取到该类加载器
用户自定义类加载器
在 Java 的日常应用程序开发中,类的加载几乎是由上述 3 种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。 为什么要自定义类加载器?
- 隔离加载类
- 修改类加载的方式
- 扩展加载源
- 防止源码泄漏
用户自定义类加载器实现步骤:
- 开发人员可以通过继承抽象类
java.1ang.ClassLoader
类的方式,实现自己的类加载器,以满足一些特殊的需求 - 在 JDK1.2 之前,在自定义类加载器时,总会去继承 ClassLoader 类并重写
loadClass()
方法,从而实现自定义的类加载类,但是在 JDK1.2 之后已不再建议用户去覆盖loadClass()
方法,而是建议把自定义的类加载逻辑写在findClass()
方法中 - 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承 URIClassLoader 类,这样就可以避免自己去编写
findClass()
方法及其获取字节码流的方式,使自定义类加载器编写更加简洁
代码实例:
java
public class CustomClassLoader extends ClassLoader {
@Override
protected Class<?> findClass(String name) throws ClassNotFoundException {
try {
byte[] result = getClassFromCustomPath(name);
if (result == null) {
throw new FileNotFoundException();
} else {
//defineClass和findClass搭配使用
return defineClass(name, result, 0, result.length);
}
} catch (FileNotFoundException e) {
e.printStackTrace();
}
throw new ClassNotFoundException(name);
}
// 自定义流的获取方式
private byte[] getClassFromCustomPath(String name) {
// 从自定义路径中加载指定类:细节略
// 如果指定路径的字节码文件进行了加密,则需要在此方法中进行解密操作。
return null;
}
public static void main(String[] args) {
CustomClassLoader customClassLoader = new CustomClassLoader();
try {
Class<?> clazz = Class.forName("One", true, customClassLoader);
Object obj = clazz.newInstance();
System.out.println(obj.getClass().getClassLoader());
} catch (Exception e) {
e.printStackTrace();
}
}
}
引导类加载器加载的目录
刚刚我们通过概念了解到了,根加载器只能够加载 java /lib 目录下的 class,我们通过下面代码验证一下
java
public class ClassLoaderTest1 {
public static void main(String[] args) {
System.out.println("*********启动类加载器************");
// 获取 Bootstrap ClassLoader 能够加载的 API 的路径
URL[] urls = sun.misc.Launcher.getBootstrapClassPath().getURLs();
for (URL url : urls) {
System.out.println(url.toExternalForm());
}
// 从上面路径中,随意选择一个类,来看看他的类加载器是什么:得到的是 null,说明是引导类加载器
ClassLoader classLoader = Provider.class.getClassLoader();
System.out.println(classLoader);
System.out.println("*********扩展类加载器************");
String extDirs = System.getProperty("java.ext.dirs");
for (String path : extDirs.split(";")){
System.out.println(path);
}
// 从上面路径中,随意选择一个类,来看看他的类加载器是什么:得到的是扩展类加载器
ClassLoader classLoader1 = CurveDB.class.getClassLoader();
System.out.println(classLoader1);
}
}
得到的结果
sh
*********启动类加载器************
file:/F:/Programming%20area/java/jdk/jre/lib/resources.jar
file:/F:/Programming%20area/java/jdk/jre/lib/rt.jar
file:/F:/Programming%20area/java/jdk/jre/lib/sunrsasign.jar
file:/F:/Programming%20area/java/jdk/jre/lib/jsse.jar
file:/F:/Programming%20area/java/jdk/jre/lib/jce.jar
file:/F:/Programming%20area/java/jdk/jre/lib/charsets.jar
file:/F:/Programming%20area/java/jdk/jre/lib/jfr.jar
file:/F:/Programming%20area/java/jdk/jre/classes
null
*********扩展类加载器************
F:\Programming area\java\jdk\jre\lib\ext
C:\WINDOWS\Sun\Java\lib\ext
sun.misc.Launcher$ExtClassLoader@12a3a380
关于ClassLoader
ClassLoader 类,它是一个抽象类,其后所有的类加载器都继承自 ClassLoader(不包括启动类加载器)
sun.misc.Launcher
是一个 Java 虚拟机的入口应用
获取 ClassLoader 的途径
- 获取当前 ClassLoader:
clazz.getClassLoader()
- 获取当前线程上下文的 ClassLoader:
Thread.currentThread().getContextClassLoader()
- 获取系统的 ClassLoader:
ClassLoader.getSystemClassLoader()
- 获取调用者的 ClassLoader:
DriverManager.getCallerClassLoader()
代码实例:
java
public class ClassLoaderTest2 {
public static void main(String[] args) {
try {
// 1.
ClassLoader classLoader = Class.forName("java.lang.String").getClassLoader();
System.out.println(classLoader);
// 2.
ClassLoader classLoader1 = Thread.currentThread().getContextClassLoader();
System.out.println(classLoader1);
// 3.
ClassLoader classLoader2 = ClassLoader.getSystemClassLoader().getParent();
System.out.println(classLoader2);
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
}
输出结果:
sh
null
sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@1540e19d
双亲委派机制
Java 虚拟机对 Class 文件采用的是 按需加载 的方式,也就是说当需要使用该类时才会将它的 Class 文件加载到内存生成 Class 对象。而且加载某个类的 Class 文件时,Java 虚拟机采用的是 双亲委派模式,即把请求交由父类处理,它是一种任务委派模式。
工作原理
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行
- 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器
- 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式
双亲委派机制举例
举例 1
1、我们自己建立一个 java.lang.String 类,写上 static 代码块
java
public class String {
static{
System.out.println("我是自定义的String类的静态代码块");
}
}
2、在另外的程序中加载 String 类,看看加载的 String 类是 JDK 自带的 String 类,还是我们自己编写的 String 类
java
public class StringTest {
public static void main(String[] args) {
java.lang.String str = new java.lang.String();
System.out.println("hello,xx.cn");
StringTest test = new StringTest();
System.out.println(test.getClass().getClassLoader());
}
}
输出结果:
java
CODE
hello,xx.cn
sun.misc.Launcher$AppClassLoader@18b4aac2
程序并没有输出我们静态代码块中的内容,可见仍然加载的是 JDK 自带的 String 类。
如果运行下面代码:
java
package java.lang;
public class String {
static{
System.out.println("我是自定义的String类的静态代码块");
}
// 错误: 在类 java.lang.String 中找不到 main 方法
public static void main(String[] args) {
System.out.println("hello,String");
}
}
由于双亲委派机制一直找父类,所以最后找到了 Bootstrap ClassLoader,Bootstrap ClassLoader 找到的是 JDK 自带的 String 类,在该 String 类中并没有 main() 方法,所以就报了上面的错误。
举例 2
java
package java.lang;
public class ShkStart {
public static void main(String[] args) {
System.out.println("hello!");
}
}
输出结果:
sh
java.lang.SecurityException: Prohibited package name: java.lang
at java.lang.ClassLoader.preDefineClass(ClassLoader.java:662)
at java.lang.ClassLoader.defineClass(ClassLoader.java:761)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:467)
at java.net.URLClassLoader.access$100(URLClassLoader.java:73)
at java.net.URLClassLoader$1.run(URLClassLoader.java:368)
at java.net.URLClassLoader$1.run(URLClassLoader.java:362)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:361)
at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:335)
at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:495)
Error: A JNI error has occurred, please check your installation and try again
Exception in thread "main"
Process finished with exit code 1
即使类名没有重复,也禁止使用 java.lang 这种包名。这是一种保护机制,这样可以保证对 java 核心源代码的保护。
举例 3
当我们加载 jdbc.jar 用于实现数据库连接的时候,首先我们需要知道的是 jdbc.jar 是基于 SPI 接口进行实现的,所以在加载的时候,会进行双亲委派,最终从根加载器中加载 SPI 核心类,然后在加载 SPI 接口类,接着在进行反向委派,通过线程上下文类加载器进行实现类 jdbc.jar 的加载。
上下文类加载器的出现背景具体看 再谈类的加载器。
沙箱安全机制
Java 安全模型的核心就是 Java 沙箱(Sandbox),什么是沙箱?沙箱就是一个限制程序运行的环境。
沙箱机制就是将 Java 代码 限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问。通过这样的措施来保证对代码的有限隔离,防止对本地系统造成破坏。
沙箱主要限制系统资源访问,那系统资源包括什么?CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的 Java 程序运行都可以指定沙箱,可以定制安全策略。
关于不同 JDK 版本的沙箱安全机制进化,请看 再谈类的加载器。
双亲委派机制的优势
通过上面的例子,我们可以知道,双亲机制可以:
- 避免类的重复加载
- 保护程序安全,防止核心 API 被随意篡改
- 自定义类:java.lang.String
- 自定义类:java.lang.ShkStart(报错:阻止创建 java.lang 开头的类)
其它
如何判断两个class对象是否相同
在 JVM 中表示两个 Class 对象是否为同一个类存在两个必要条件:
- 类的完整类名必须一致,包括包名
- 加载这个类的 ClassLoader(指 ClassLoader 实例对象)必须相同
换句话说,在 JVM 中,即使这两个类对象(Class 对象)来源同一个 Class 文件,被同一个虚拟机所加载,但只要加载它们的 ClassLoader 实例对象不同,那么这两个类对象也是不相等的。
JVM 必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么 JVM 会将这个类加载器的一个引用作为类型信息的一部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM 需要保证这两个类型的类加载器是相同的。
类的主动使用和被动使用
Java 程序对类的使用方式分为:主动使用和被动使用。
主动使用,又分为七种情况:
创建类的实例
访问某个类或接口的静态变量,或者对该静态变量赋值
调用类的静态方法
反射,比如:
Class.forName("cn.xx.Test")
初始化一个类的子类
Java 虚拟机启动时被标明为启动类的类
JDK7 开始提供的动态语言支持
java.lang.invoke.MethodHandle
实例的解析结果 REF getStatic、REF putStatic、REF invokeStatic 句柄对应的类没有初始化,则初始化除了以上七种情况,其他使用 Java 类的方式都被看作是对类的被动使用,都不会导致类的初始化