之前我们说了:
1,可见性
2,原子性
3,有序性
3个并发BUG的之源,这三个也是编程领域的共性问题。Java诞生之处就支持多线程,所以自然有解决这些问题的办法,而且在编程语言领域处于领先地位。理解Java解决并发问题的方案,对于其他语言的解决方案也有触类旁通的效果。
什么是Java内存模型
我们已经知道了,导致可见性的原因是缓存,导致有序性的问题是编译优化。那解决问题的办法就是直接禁用 缓存和编译优化
。但是直接不去使用这些是不行了,性能无法提升。
所以合理的方案是 按需禁用缓存和编译优化。如何做到“按需禁用”
,只有编写代码的程序员自己知道,所以程序需要给程序员按需禁用和编译优化
的方法才行。
Java的内存模型如果站在程序员的角度,可以理解为,Java内存模型规范了JVM如何提供按需禁用缓存和编译优化的方法。具体来说,这些方法包括volatile
,synchronized
和final
三个关键字段。
以及六项 Happens-Before
规则。
使用volatile的困惑
volatile
关键字并不是 Java 语言特有的,C语言也有,它的原始意义就是禁用CPU缓存。
例如,我们声明一个volatile
变量 ,volatile int x = 0
,它表达的是:告诉编译器,对这个变量的读写,不能使用 CPU 缓存,必须从内存中读取或者写入。看起来语义很明确,实际情况比较困惑。
看下以下代码:
class VolatileExample {
int x = 0;
volatile boolean v = false;
public void writer() {
x = 42;
v = true;
}
public void reader() {
if (v == true) {
// 这里 x 会是多少呢?
}
}
}
直觉上看,这里的X应该是42,那实际应该是多少呢?这个要看Java的版本,如果在低于 1.5 版本上运行,x 可能是42,也有可能是 0;如果在 1.5 以上的版本上运行,x 就是等于 42。
分析一下,为什么 1.5 以前的版本会出现 x = 0 的情况呢?因为变量 x 可能被 CPU 缓存而导致可见性问题。这个问题在 1.5 版本已经被圆满解决了。Java 内存模型在 1.5 版本对 volatile 语义进行了增强。怎么增强的呢?答案是一项 Happens-Before
规则。
Happens-Before 规则
这里直接给出定义:
Happens-Before :前面一个操作的结果对后续操作是可见的。
再进一步的讲:Happens-Before 约束了编译器的优化行为,虽允许编译器优化,但是要求编译器优化后一定遵守 Happens-Before 规则。
看一看Java内存模型定义了哪些重要的Happens-Before
规则
1,程序的顺序性规则
这条规则是指在一个线程中,按照程序顺序,前面的操作 Happens-Before
于后续的任意操作。比如刚才那段示例代码,按照程序的顺序,第 6 行代码 x = 42;
Happens-Before 于第 7 行代码 v = true;
,这就是规则 1 的内容,也比较符合单线程里面的思维:程序前面对某个变量的修改一定是对后续操作可见的。
2,volatile 变量规则
这条规则是指对一个 volatile 变量的写操作,Happens-Before
于后续对这个 volatile 变量的读操作。
这个就有点费解了,对一个 volatile 变量的写操作相对于后续对这个 volatile 变量的读操作可见。
3,传递性
这条规则是指如果 A Happens-Before B,且 B Happens-Before C,那么 A Happens-Before C。
我们将规则 3 的传递性应用到我们的例子中,可以看下面这幅图:
class VolatileExample {
int x = 0;
volatile boolean v = false;
public void writer() {
x = 42;
v = true;
}
public void reader() {
if (v == true) {
// 这里 x 会是多少呢?
}
}
}
从图中可以看到
1,x=42 Happens-Before
写 v=true,这是规则1
2,读v=true Happens-Before
读变量X,这是规则2
结合传递性读定义,即:
线程A的 x=42 Happens-Before
线程B的 读变量X
java 1.5对 volatile 的增强就是这个,根据这个定义就保证了之前的 x=42
的成立
4,管程中锁的规则
这条规则是指对一个锁的解锁 Happens-Before 于后续对这个锁的加锁。
管程 (英语:Moniters,也称为监视器) 是一种程序结构,结构内的多个子程序(对象或模块)形成的多个工作线程互斥访问共享资源。
管程
在 Java 中指的就是 synchronized,synchronized 是 Java 里对管程的实现。管程
中的锁在 Java 里是隐式实现的,例如下面的代码,在进入同步块之前,会自动加锁,而在代码块执行完会自动释放锁,加锁以及释放锁都是编译器帮我们实现的。
synchronized (this) { // 此处自动加锁
// x 是共享变量, 初始值 =10
if (this.x < 12) {
this.x = 12;
}
} // 此处自动解锁
所以结合规则定义,可以这样理解:假设 x 的初始值是 10,线程 A 执行完代码块后 x 的值会变成 12(执行完自动释放锁),线程 B 进入代码块时,能够看到线程 A 对 x 的写操作,也就是线程 B 能够看到 x==12。这个也是符合我们直觉的,应该不难理解。
5,线程 start() 规则
这条是关于线程启动的。它是指主线程 A 启动子线程 B 后,子线程 B 能够看到主线程在启动子线程 B 前的操作。
换句话说就是,如果线程 A 调用线程 B 的 start() 方法(即在线程 A 中启动线程 B),那么该 start() 操作 Happens-Before 于线程 B 中的任意操作。具体可参考下面示例代码。
Thread B = new Thread(()->{
// 主线程调用 B.start() 之前
// 所有对共享变量的修改,此处皆可见
// 此例中,var==77
});
// 此处对共享变量 var 修改
var = 77;
// 主线程启动子线程
B.start();
6,线程 join() 规则
这条是关于线程等待的。它是指主线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的 join() 方法实现),当子线程 B 完成后(主线程 A 中 join() 方法返回),主线程能够“看到”子线程的操作。这里的“看到”,指的是子线程对共享变量的操作。
换句话说就是,如果在线程 A 中,调用线程 B 的 join() 并成功返回,那么线程 B 中的任意操作 Happens-Before 于该 join() 操作的返回。具体可参考下面示例代码。
Thread B = new Thread(()->{
// 此处对共享变量 var 修改
var = 66;
});
// 例如此处对共享变量修改,
// 则这个修改结果对线程 B 可见
// 主线程启动子线程
B.start();
B.join()
// 子线程所有对共享变量的修改
// 在主线程调用 B.join() 之后皆可见
// 此例中,var==66
过度优化的 final
前面我们讲 volatile 为的是禁用缓存以及编译优化,那 final关键字 就是告诉编译器优化得更好一点。
final 修饰变量时,初衷是告诉编译器:这个变量生而不变,可以尽量优化。但是Java编译器在 1.5 以前的版本导致优化错误了。
构造函数的错误重排导致线程可能看到 final 变量的值会变化。详细的案例可以参考:http://www.cs.umd.edu/~pugh/j...
当然了,在 1.5 以后 Java 内存模型对 final
类型变量的重排进行了约束。现在只要我们提供正确构造函数没有“逸出”,就不会出问题了。
在下面例子中,在构造函数里面将 this 赋值给了全局变量 global.obj,这就是“逸出”,线程通过 global.obj 读取 x 是有可能读到 0 的。因此我们一定要避免“逸出”。
final int x;
// 错误的构造函数
public FinalFieldExample() {
x = 3;
y = 4;
// 此处就是讲 this 逸出,
global.obj = this;
}
总结
Java 的内存模型是并发编程领域的一次重要创新,Happens-Before 的语义是一种因果关系。在现实世界里,如果 A 事件是导致 B 事件的起因,那么 A 事件一定是先于(Happens-Before)B 事件发生的,这个就是 Happens-Before 语义的现实理解。
在 Java 语言里面,Happens-Before 的语义本质上是一种可见性,A Happens-Before B 意味着 A 事件对 B 事件来说是可见的,无论 A 事件和 B 事件是否发生在同一个线程里。例如 A 事件发生在线程 1 上,B 事件发生在线程 2 上,Happens-Before 规则保证线程 2 上也能看到 A 事件的发生。
Java 内存模型主要分为两部分,一部分面向你我这种编写并发程序的应用开发人员,另一部分是面向 JVM 的实现人员的,我们可以重点关注前者,也就是和编写并发程序相关的部分,这部分内容的核心就是 Happens-Before 规则。
参考:
Java内存模型
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。