JVM学习笔记（五）内存模型-EW帮帮网

与【java 内存结构】不同，【java 内存模型】是Java Memory Model（JMM）的意思。

前三章主要介绍java内存结构（组成）、垃圾回收、字节码技术、类加载器，与内存模型这一章关联更多的是多线程，与前面的关联不大。

简单的说，JMM 定义了一套在多线程读写共享数据时（成员变量、数组）时，对数据的可见性、有序性、和原子性的规则和保障（权威解释可参考官网）。

1、原子性

1.1 问题分析

举例：两个线程对初始值为 0 的静态变量一个做自增，一个做自减，各做 5000 次，结果是 0 吗？结果可能是正数、负数、零。为什么呢？因为 Java 中对静态变量的自增，自减并不是原子操
作。

public class Demo3_1 {

    static int a = 10;

    public static void main(String[] args) {
        addTest();

    }

    public static void addTest(){
        a++;
    }
}

对于 i++ 而言（i 为静态变量），实际会产生如下的 JVM 字节码指令：

getstatic     i // 获取静态变量i的值
iconst_1         // 准备常量1
iadd             // 加法
putstatic     i // 将修改后的值存入静态变量i

对于 i-- 也是类似：

getstatic     i // 获取静态变量i的值
iconst_1         // 准备常量1
isub             // 减法
putstatic     i // 将修改后的值存入静态变量i

而 Java 的内存模型如下，完成静态变量的自增，自减需要在主存和线程内存中进行数据交换：

如果是单线程以下 8 行代码是顺序执行（不会交错）没有问题：

// 假设i的初始值为0
getstatic     i // 线程1-获取静态变量i的值 线程内i=0
iconst_1         // 线程1-准备常量1
iadd             // 线程1-自增 线程内i=1
putstatic     i // 线程1-将修改后的值存入静态变量i 静态变量i=1
getstatic     i // 线程1-获取静态变量i的值 线程内i=1
iconst_1         // 线程1-准备常量1
isub             // 线程1-自减 线程内i=0
putstatic     i // 线程1-将修改后的值存入静态变量i 静态变量i=0

但多线程下这 8 行代码可能交错运行

出现负数的情况：

// 假设i的初始值为0
getstatic     i // 线程1-获取静态变量i的值 线程内i=0
getstatic     i // 线程2-获取静态变量i的值 线程内i=0
iconst_1         // 线程1-准备常量1
iadd             // 线程1-自增 线程内i=1
putstatic     i // 线程1-将修改后的值存入静态变量i 静态变量i=1
iconst_1         // 线程2-准备常量1
isub             // 线程2-自减 线程内i=-1
putstatic     i // 线程2-将修改后的值存入静态变量i 静态变量i=-1

出现正数的情况：

// 假设i的初始值为0
getstatic     i // 线程1-获取静态变量i的值 线程内i=0
getstatic     i // 线程2-获取静态变量i的值 线程内i=0
iconst_1         // 线程1-准备常量1
iadd             // 线程1-自增 线程内i=1
iconst_1         // 线程2-准备常量1
isub             // 线程2-自减 线程内i=-1
putstatic     i // 线程2-将修改后的值存入静态变量i 静态变量i=-1
putstatic     i // 线程1-将修改后的值存入静态变量i 静态变量i=1

1.2 解决方法

synchronized （同步关键字），语法：

synchronized( 对象 ) {
    要作为原子操作代码
}

用 synchronized 解决并发问题：

static int i = 0;
static Object obj = new Object();
public static void main(String[] args) throws InterruptedException {
   Thread t1 = new Thread(() -> {
       for (int j = 0; j < 5000; j++) {
           synchronized (obj) {
               i++;
          }
      }
  });
   Thread t2 = new Thread(() -> {
       for (int j = 0; j < 5000; j++) {
           synchronized (obj) {
               i--;
          }
      }
  });
   t1.start();
   t2.start();
   t1.join();
   t2.join();
   System.out.println(i);
}

优化：将synchronized提取到for循环外面，减少了加锁/解锁的次数：

        Thread t1 = new Thread(() -> {
            synchronized (obj) {
                for (int j = 0; j < 5000; j++) {
                    i++;
                }
            }
        });

注意：上例中 t1 和 t2 线程必须用 synchronized 锁住同一个 obj 对象，否则没法起到同步的效果。

2、可见性

2.1 退不出的循环

现象如下，main 线程对 run 变量的修改对于 t 线程不可见，导致了 t 线程无法停止：

static boolean run = true;
public static void main(String[] args) throws InterruptedException {
   Thread t = new Thread(()->{
       while(run){
           // ....
      }
  });
   t.start();
   Thread.sleep(1000);
   run = false; // 线程t不会如预想的停下来
}

分析原因：

初始状态， t 线程刚开始从主内存读取了 run 的值到工作内存。

因为 t 线程要频繁从主内存中读取 run 的值，JIT 编译器会将 run 的值缓存至自己工作内存中的高速缓存中，减少对主存中 run 的访问，提高效率。

一秒之后，main 线程修改了 run 的值，并同步至主存，而 t 是从自己工作内存中的高速缓存中读取这个变量的值，结果永远是旧值。

2.2 解决办法

volatile（易变关键字）
它可以用来修饰成员变量和静态成员变量，它可以避免线程从自己的工作缓存中查找变量的值，必须到主存中获取它的值，线程操作 volatile 变量都是直接操作主存。

可见性，它保证的是在多个线程之间，一个线程对 volatile 变量的修改对另一个线程可见，volatile 不能保证原子性，仅用在一个写线程，多个读线程的情况。

synchronized 语句块既可以保证代码块的原子性，也同时保证代码块内变量的可见性。但缺点是synchronized是属于重量级操作，性能相对更低。

如果在前面示例的死循环中加入 System.out.println() 会发现即使不加 volatile 修饰符，线程 t 也能正确看到对 run 变量的修改了，想一想为什么？（因为被synchronized同步代码块了）

3、有序性

3.1 诡异的结果

int num = 0;
boolean ready = false;
// 线程1 执行此方法
public void actor1(I_Result r) {
   if(ready) {
       r.r1 = num + num;
  } else {
       r.r1 = 1;
  }
}
// 线程2 执行此方法
public void actor2(I_Result r) {
   num = 2;
   ready = true;
}

I_Result 是一个对象，有一个属性 r1 用来保存结果，问：可能的结果有几种？

情况1：线程1 先执行，这时 ready = false，所以进入 else 分支结果为 1；
情况2：线程2 先执行 num = 2，但没来得及执行 ready = true，线程1 执行，还是进入 else 分支，结果为1；
情况3：线程2 执行到 ready = true，线程1 执行，这回进入 if 分支，结果为 4（因为 num 已经执行过了）；

但还有可能是0，这种情况下是：线程2 执行ready=true，切换到线程1，进入if分支，相加为0，再切回线程2执行num=2；这种现象叫做指令重排，是 JIT 编译器在运行时的一些优化，这个现象需要通过大量测试才能复现：借助java并发压测工具jcstress。

3.2 解决办法

volatile 修饰的变量，可以禁用指令重排。

volatile boolean ready = false;

3.3 有序性理解

static int i;
static int j;


// 在某个线程内执行如下赋值操作
i = ...; // 较为耗时的操作
j = ...;

可以看到，上面的代码不管先执行 i 还是先执行 j ，对最终的结果不会产生影响。所以，上面代码真正执行时，既可以是先i后j，也可以先j后i。JVM 会在不影响正确性的前提下，可以调整语句的执行顺序，这种特性称之为『指令重排』。多线程下『指令重排』会影响正确性，例如著名的double-checked locking模式实现单例：（使用时须加volatile）

public final class Singleton {
   private Singleton() { }
   private static Singleton INSTANCE = null;
   public static Singleton getInstance() {
       // 实例没创建，才会进入内部的 synchronized代码块
       if (INSTANCE == null) {            
           synchronized (Singleton.class) {
               // 也许有其它线程已经创建实例，所以再判断一次
               if (INSTANCE == null) {
                   INSTANCE = new Singleton();
              }
          }
      }
       return INSTANCE;
  }
}

以上的实现特点是：

懒惰实例化
首次使用 getInstance() 才使用 synchronized 加锁，后续使用时无需加锁

但在多线程环境下，上面的代码是有问题的， INSTANCE = new Singleton() 对应的字节码为：

0: new           #2                 // class cn/itcast/jvm/t4/Singleton
3: dup
4: invokespecial #3                 // Method "<init>":()V
7: putstatic     #4                 // Field
INSTANCE:Lcn/itcast/jvm/t4/Singleton;

其中 4 7 两步的顺序不是固定的，也许 jvm 会优化为：先将引用地址赋值给 INSTANCE 变量后，再执行构造方法，如果两个线程 t1，t2 按如下时间序列执行：

时间1 t1 线程执行到 INSTANCE = new Singleton();

时间2 t1 线程分配空间，为Singleton对象生成了引用地址（0 处）

时间3 t1 线程将引用地址赋值给 INSTANCE，这时 INSTANCE != null（7 处）

时间4 t2 线程进入getInstance() 方法，发现 INSTANCE != null（synchronized块外），直接返回 INSTANCE

时间5 t1 线程执行Singleton的构造方法（4 处）

这时 t1 还未完全将构造方法执行完毕，如果在构造方法中要执行很多初始化操作，那么 t2 拿到的是将是一个未初始化完毕的单例。

对 INSTANCE 使用 volatile 修饰即可，可以禁用指令重排，但要注意在 JDK 5 以上的版本的 volatile 才会真正有效。

3.4 happens-before

happens-before规定了哪些写操作对其它线程的读操作可见，它是可见性与有序性的一套规则总结。抛开以下happens-before规则，JMM并不能保证一个线程对共享变量的写，对于其它线程对该共享变量的读可见。（以下变量都是指成员变量或静态成员变量）

线程解锁synchronized(m)之前对变量的写，对于接下来对synchronized(m)加锁的其它线程对该变量的读可见；
线程对volatile变量的写，对接下来其它线程对该变量的读可见；
线程 start 前对变量的写，对该线程开始后对该变量的读可见；
线程结束前对变量的写，对其它线程得知它结束后的读可见（比如其它线程调用 t1.isAlive() 或 t1.join()等待它结束）；
线程 t1 打断 t2（interrupt）前对变量的写，对于其他线程得知 t2 被打断后对变量的读可见（通过t2.interrupted 或 t2.isInterrupted）；
对变量默认值（0，false，null）的写，对其它线程对该变量的读可见。

具有传递性，如果 x hb-> y 并且 y hb-> z 那么有 x hb-> z。

4、CAS与原子类

4.1 CAS

CAS即Compare and Swap，它体现的一种乐观锁的思想，比如多个线程要对一个共享的整型变量执行+1操作：

// 需要不断尝试
while(true) {
 int 旧值 = 共享变量 ; // 比如拿到了当前值 0
 int 结果 = 旧值 + 1; // 在旧值 0 的基础上增加 1 ，正确结果是 1
 
 /*
   这时候如果别的线程把共享变量改成了 5，本线程的正确结果 1 就作废了，这时候
   compareAndSwap 返回 false，重新尝试，直到：
   compareAndSwap 返回 true，表示我本线程做修改的同时，别的线程没有干扰
 */
 if( compareAndSwap ( 旧值, 结果 )) {
   // 成功，退出循环
 }
}

获取共享变量时，为了保证该变量的可见性，需要使用volatile修饰。结合CAS和volatile可以实现无锁并发，适用于竞争不激烈、多核CPU的场景下。

因为没有使用 synchronized，所以线程不会陷入阻塞，这是效率提升的因素之一；
但如果竞争激烈，可以想到重试必然频繁发生，反而效率会受影响。

CAS 底层依赖于一个 Unsafe 类来直接调用操作系统底层的 CAS 指令（无需掌握，java中已经封装成原子类了，掌握原子类即可）。

4.2 乐观锁与悲观锁

CAS 是基于乐观锁的思想：最乐观的估计，不怕别的线程来修改共享变量，就算改了也没关系，我吃亏点再重试呗。
synchronized 是基于悲观锁的思想：最悲观的估计，得防着其它线程来修改共享变量，我上了锁你们都别想改，我改完了解开锁，你们才有机会。

总结：java中的乐观锁就是CAS，悲观锁就是synchronized。

4.3 原子操作类

JUC（java.util.concurrent）中提供了原子操作类，可以提供线程安全的操作，如AtomicInteger、AtomicBoolean，它们底层就是采用CAS技术+volatile来实现的。

可以使用AtomicInteger改写之前的例子：

// 创建原子整数对象(AtomicInteger就是采用CAS技术+volatile来实现的，代码中无需再加volatile)
private static AtomicInteger i = new AtomicInteger(0);

public static void main(String[] args) throws InterruptedException {
    Thread t1 = new Thread(() -> {
        for (int j = 0; j < 5000; j++) {
            i.getAndIncrement(); // 获取并且自增 i++
            //i.incrementAndGet(); // 自增并且获取 ++i
        }
    });
    Thread t2 = new Thread(() -> {
        for (int j = 0; j < 5000; j++) {
            i.getAndDecrement(); // 获取并且自减 i--
        }
    });
    t1.start();
    t2.start();
    t1.join();
    t2.join();
    System.out.println(i);
}

5、synchronized 优化

Java HotSpot 虚拟机中，每个对象都有对象头（包括 class 指针和 Mark Word）。Mark Word 平时存储这个对象的哈希码、分代年龄，当加锁时，这些信息就根据情况被替换为标记位、线程锁记录指针、重量级锁指针、线程ID等内容。

5.1 轻量级锁

如果一个对象虽然有多线程访问，但多线程访问的时间是错开的（也就是没有竞争），那么可以使用轻量级锁来优化。

每个线程的栈帧都会包含一个锁记录的结构，内部可以存储锁定对象的 Mark Word；对象Mark Word会保存持有锁的记录地址，也就是说只有将这个地址修改为本线程的地址，才能加锁成功。

01（无锁）

00（轻量锁）

5.2 锁膨胀

如果在尝试加轻量级锁的过程中，CAS 操作无法成功，这时一种情况就是有其它线程为此对象加上了轻量级锁（有竞争），这时需要进行锁膨胀，将轻量级锁变为重量级锁。

通俗地说，轻量级锁是在A线程整个调用期间都没有竞争，若A线程执行任务还未结束前，B线程来了，这时就产生了竞争，就会锁膨胀——将轻量级锁变为重量级锁。

Mark Word会保存重量锁标记10，还会保存重量锁指针。

10（重量锁）

5.3 重量锁

重量级锁竞争的时候，还可以使用自旋来进行优化，如果当前线程自旋成功（即这时候持锁线程已经退出了同步块，释放了锁），这时当前线程就可以避免阻塞。
在 Java 6 之后自旋锁是自适应的，比如对象刚刚的一次自旋操作成功过，那么认为这次自旋成功的可能性会高，就多自旋几次；反之，就少自旋甚至不自旋，比较智能。

自旋会占用 CPU 时间，单核 CPU 自旋就是浪费，多核 CPU 自旋才能发挥优势。
好比等红灯时汽车是不是熄火，不熄火相当于自旋（等待时间短了划算），熄火了相当于阻塞（等待时间长了划算）。
Java 7 之后不能控制是否开启自旋功能。

自旋重试成功即加锁成功，自旋重试失败后进入阻塞状态。

5.4 偏向锁

轻量级锁在没有竞争时（就自己这个线程），每次重入仍然需要执行 CAS 操作。Java 6 中引入了偏向锁来做进一步优化：只有第一次使用 CAS 将线程 ID 设置到对象的 Mark Word 头，之后发现这个线程ID是自己的就表示没有竞争，不用重新CAS。【毁誉参半】

撤销偏向需要将持锁线程升级为轻量级锁，这个过程中所有线程需要暂停（STW）；
访问对象的 hashCode 也会撤销偏向锁；
如果对象虽然被多个线程访问，但没有竞争，这时偏向了线程 T1 的对象仍有机会重新偏向T2，重偏向会重置对象的 Thread ID；
撤销偏向和重偏向都是批量进行的，以类为单位；
如果撤销偏向到达某个阈值，整个类的所有对象都会变为不可偏向的；
可以主动使用 -XX:-UseBiasedLocking 禁用偏向锁。

5.5 其它优化

1. 减少上锁时间

同步代码块中尽量短

2. 减少锁的粒度

将一个锁拆分为多个锁提高并发度，例如：

ConcurrentHashMap；
LongAdder 分为 base 和 cells 两部分。没有并发争用的时候或者是 cells 数组正在初始化的时候，会使用 CAS 来累加值到 base，有并发争用，会初始化 cells 数组，数组有多少个 cell，就允许有多少线程并行修改，最后将数组中每个 cell 累加，再加上 base 就是最终的值；
LinkedBlockingQueue 入队和出队使用不同的锁，相对于LinkedBlockingArray只有一个锁效率要高；

3. 锁粗化

多次循环进入同步块不如同步块内多次循环

另外 JVM 可能会做如下优化，把多次 append 的加锁操作粗化为一次（因为都是对同一个对象加锁，没必要重入多次）

new StringBuffer().append("a").append("b").append("c");

4. 锁消除

JVM 会进行代码的逃逸分析，例如某个加锁对象是方法内局部变量，不会被其它线程所访问到，这时候就会被即时编译器忽略掉所有同步操作。

5. 读写分离

CopyOnWriteArrayList

ConyOnWriteSet

参考：

Synchronization - Synchronization - OpenJDK Wiki

java锁优化 | Zane Blog

聊聊并发（二）——Java SE1.6中的Synchronized_Java_方腾飞_InfoQ精选文章

Java锁优化--JVM锁降级 - 简书

https://www.cnblogs.com/sheeva/p/6366782.html

multithreading - Does Java ever rebias an individual lock - Stack Overflow

JVM学习笔记（五）内存模型