CountDownLatch And CyclicBarrier个人笔记

引言： CountDownLatch和 CyclicBarrier都是java.uti.concurrent包下的对多线程协作的同步辅助工具。

CountDownLatch

定义

Jdk源码对CountDownLatch的定义是：

A synchronization aid that allows one or more threads to wait until a set of operations being performed in other threads completes.

翻译下来的意思是：允许一个或多个线程等待直至一组操作都被其他线程处理完成的同步辅助工具。

CountDownLatch在初始化的时候需要传入一个数值count，调用await函数将会阻塞直到通过调用countDown函数将数值count减至为0，在这之前所有阻塞的线程将会被释放，并且由于CountDownLatch是一次性的，在此之后，调用await会立即返回。

场景

在多线程协作的情况，经常会有这样的需求: 线程A的执行需要在若干个条件达成之后，而这些条件可能会由其他不同的线程去达成，并且要求其他线程在达到某个条件后不进入阻塞，继续处理自己的其他任务。举个比较简单的生活例子，去饭店吃饭，那么在你吃之前需要等待厨师帮你把菜炒好，在饭菜准备好之前你可能需要先等一会，等厨师准备好递到你面前后你才能够享用这份美食，而厨师在做完你点的饭菜后，也不会等你吃完再，而是继续做其他顾客点的饭菜。

在多线程并发的情况下，如果通过锁由用户自己去实现上述控制多线程间的执行顺序，可能需要开发者对多线程并发协作有一个比较好的基础，而jdk针对这个多线程同步协作的多线程并发模型，封装为CountDownLatch多线程协作辅助类，使得用户可以比较简单地直接使用。

CountDownLatch适用于非常多的场景，它既可以作为一个开关(类似于锁)，也能作为多条件任务的协作辅助工具。

我们举几个场景进行说明

场景一（开关+多任务协作）

class Driver { // ...
  void main() throws InterruptedException {
      // 构造函数传入:1，作为开始启动的开关
    CountDownLatch startSignal = new CountDownLatch(1);
    // 构造函数传入:N, 表示n个条件的多线程任务协作
    CountDownLatch doneSignal = new CountDownLatch(N);
 
         // 创建多线程
    for (int i = 0; i < N; ++i) // create and start threads
      new Thread(new Worker(startSignal, doneSignal)).start();
          // 启动后的初始化操作
    doSomethingElse();            // don't let run yet
    // countDown将count转为0，调用startSignal.await()而进入阻塞的所有其他线程将被释放，并执行后续操作。
    startSignal.countDown();      // let all threads proceed
    doSomethingElse();
    // 等待doneSignal的count从n送到0，表示所有任务处理完成
    doneSignal.await();           // wait for all to finish
  }
}
 
class Worker implements Runnable {
  private final CountDownLatch startSignal;
  private final CountDownLatch doneSignal;
  // 传入startSignal和doneSignal
  Worker(CountDownLatch startSignal, CountDownLatch doneSignal) {
    this.startSignal = startSignal;
    this.doneSignal = doneSignal;
  }
  public void run() {
    try {
        // 线程启动后等待startSignal的count被转为0后，才开始执行任务
      startSignal.await();
      doWork();
      // 执行完任务后，调用countDown将doneSignal的count减1,表示其中一个条件达成。
      doneSignal.countDown();
    } catch (InterruptedException ex) {} // return;
  }

场景二（多任务协作）

class Driver2 { 
  void main() throws InterruptedException {
      // 构造函数传入n，表示n个条件
    CountDownLatch doneSignal = new CountDownLatch(N);
    Executor e = ...
 
    for (int i = 0; i < N; ++i) // create and start threads
      e.execute(new WorkerRunnable(doneSignal, i));
         // 等待所有任务被执行
    doneSignal.await();           // wait for all to finish
  }
}
 
class WorkerRunnable implements Runnable {
  private final CountDownLatch doneSignal;
  private final int i;
  WorkerRunnable(CountDownLatch doneSignal, int i) {
    this.doneSignal = doneSignal;
    this.i = i;
  }
  public void run() {
    try {
      doWork(i);
      // 每个任务执行完成后，调用doneSignal.countDown()，表示所需条件数减1
      doneSignal.countDown();
    } catch (InterruptedException ex) {} // return;
  }
 
  void doWork() { ... }
}}

底层实现

构造函数

CountDownLatch只提供了一个单参数的构造函数，count表示需要协作的条件数/任务数，内部维护了一个内部类Sync对象。

public CountDownLatch(int count) {
    if (count < 0) throw new IllegalArgumentException("count < 0");
    this.sync = new Sync(count);
}

内部类Sync

内部类Sync主要继承了AbstractQueuedSynchronizer(即大名鼎鼎的aqs框架)，内部通过维护state来表示当前的状态，state表示未完成的任务数。

private static final class Sync extends AbstractQueuedSynchronizer {
        private static final long serialVersionUID = 4982264981922014374L;

        Sync(int count) {
            setState(count);
        }

        int getCount() {
            return getState();
        }

        protected int tryAcquireShared(int acquires) {
            return (getState() == 0) ? 1 : -1;
        }
                
                // 循环通过cas操作对state进行减一操作
        protected boolean tryReleaseShared(int releases) {
            // Decrement count; signal when transition to zero
            for (;;) {
                int c = getState();
                if (c == 0)
                    return false;
                int nextc = c-1;
                if (compareAndSetState(c, nextc))
                    return nextc == 0;
            }
        }
    }

await

await支持无限时间阻塞和有限时间阻塞两种，从方法签名上来看，它是支持响应中断的。

public void await() throws InterruptedException {
        sync.acquireSharedInterruptibly(1);
}
public boolean await(long timeout, TimeUnit unit)
        throws InterruptedException {
        return sync.tryAcquireSharedNanos(1, unit.toNanos(timeout));
}

我们再看sync.tryAcquireSharedNanos(1, unit.toNanos(timeout))做了什么处理

public final void acquireSharedInterruptibly(int arg)
    throws InterruptedException {
    if (Thread.interrupted())
               throw new InterruptedException();
    if (tryAcquireShared(arg) < 0)
            doAcquireSharedInterruptibly(arg);
}

结合内部类Sync来看，tryAcquireShared函数的返回是根据state的数值来返回，如果state为0，返回1，直接返回；如果state!=0，表示尚有任务未完成，则返回-1，进入doAcquireSharedInterruptibly函数。

private void doAcquireSharedInterruptibly(int arg)
        throws InterruptedException {
        final Node node = addWaiter(Node.SHARED);
        boolean failed = true;
        try {
                // 循环入队，添加到等待队列
            for (;;) {
                final Node p = node.predecessor();
                if (p == head) {
                        // 尝试再次判断，如果返回r>=0，表示state=0,即所有任务已经处理完成，直接返回
                    int r = tryAcquireShared(arg);
                    if (r >= 0) {
                        setHeadAndPropagate(node, r);
                        p.next = null; // help GC
                        failed = false;
                        return;
                    }
                }
                // 判断是否需要进行阻塞等待，如果时，通过LockSupport的unpark进入阻塞状态。
                if (shouldParkAfterFailedAcquire(p, node) &&
                    parkAndCheckInterrupt())
                    throw new InterruptedException();
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

doAcquireSharedInterruptibly的逻辑主要是将当前线程添加进等待队列，并且在满足条件的情况进入阻塞状态。

countDown

countDown的实现逻辑非常简单，所有的实现是交由它的内部Sync来实现。

public void countDown() {
        sync.releaseShared(1);
}

我们再看sync.releaseShared的主要实现，tryReleaseShared的实现逻辑在内部类Sync中，可以回过头去看一下，实际上也就是循环通过cas让state减1，最后返回state==0，也就是说如果state减一后等于0，那么将会进入doReleaseShared函数。

public final boolean releaseShared(int arg) {
        if (tryReleaseShared(arg)) {
            doReleaseShared();
            return true;
        }
        return false;
    }

这里我们主要关注doReleaseShared这个函数主要实现了什么逻辑。

在上文提到的doAcquireSharedInterruptibly函数主要是创建node并添加入等待队列，同时阻塞线程，而这里的doReleaseShared的则主要是循环逻辑等待队列，将等待队列中的node移除，并唤醒阻塞的线程。

private void doReleaseShared() {
        for (;;) {
            Node h = head;
            if (h != null && h != tail) {
                int ws = h.waitStatus;
                if (ws == Node.SIGNAL) {
                    if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0))
                        continue;            // loop to recheck cases
                    // 唤醒阻塞线程，并更新头结点引用
                    unparkSuccessor(h);
                }
                else if (ws == 0 &&
                         !compareAndSetWaitStatus(h, 0, Node.PROPAGATE))
                    continue;                // loop on failed CAS
            }
            if (h == head)                   // loop if head changed
                break;
        }
    }

总结

CountDownLatch是一个允许一个或多个线程等待直至一组操作都被其他线程处理完成的同步辅助工具。
CountDownLatch是临时的，不可重复使用。
CountDownLatch内部通过继承aqs框架的内部类Sync来实现。

CyclicBarrier

定义

jdk源码对CyclicBarrier的定义是这样的：

A synchronization aid that allows a set of threads to all wait for each other to reach a common barrier point.

翻译下来的意思即：允许一组线程都等待对方都到达一个共同屏障点的同步辅助工具。另外，Cyclic表示它是一个可重复使用的工具，在每次同步协作后，只要是正常完成任务或者调用reset函数，它都能够重置状态并准备好在下次同步协助时被使用。

使用场景

在一些场景下，我需要可能会将一些复杂的任务划为多个子任务来处理，在一些特殊的情况下，我们需要子任务执行到某一个位置（我们称之为屏障点），停下来等待所有其他子任务也执行到某一个位置，然后所有子任务再继续往下处理；或者是所有子任务都处理到某个屏障点时，去触发某个任务或者指令。这里边的同步等待顺序如果要开发者自己实现，可能需要开发者对多线程并发协作有一个比较好的基础，而jdk针对这个多线程同步协作的多线程并发模型，封装为CyclicBarrier同步辅助工具，使得用户可以比较简单地直接使用。

官方举了一个合并矩阵的应用场景：

有一个多行矩阵，要求在每一行处理完成后进行合并操作，利用CyclicBarrier这个辅助工具就可以简单的进行实现。

class Solver {
final int N;
final float[][] data;
final CyclicBarrier barrier;

// 每一行的处理线程，简称 worker
class Worker implements Runnable {
  int myRow;
  Worker(int row) { myRow = row; }
  public void run() {
    while (!done()) {
        // 处理行
      processRow(myRow);
 
      try {
          // 处理完成后，同步等待公共屏障, 这一步实际是等待所有Worker线程都执行到barrier.await()
          // 实际上前所有处理行的子任务都到达这屏障点后，就会自动处理合并行的任务（见Solver类中定义的barrierAction）。
        barrier.await();
      } catch (InterruptedException ex) {
        return;
      } catch (BrokenBarrierException ex) {
        return;
      }
    }
  }
}
// 处理者，进行任务分派
public Solver(float[][] matrix) {
  data = matrix;
  N = matrix.length;
  // 定义到达公共屏幕后需要处理的行为指令，这里为合并行操作。
  Runnable barrierAction =
    new Runnable() { public void run() { mergeRows(...); }};
  barrier = new CyclicBarrier(N, barrierAction);
 
  List<Thread> threads = new ArrayList<Thread>(N);
  for (int i = 0; i < N; i++) {
      // 启动多个子任务，每个任务都是负责处理矩阵其中一行
    Thread thread = new Thread(new Worker(i));
    threads.add(thread);
    thread.start();
  }
 
  // wait until done
  for (Thread thread : threads)
    thread.join();
}
}}

底层实现

构造函数

CyclicBarrier类中提供了两个构造函数，分别为CyclicBarrier(int parties)和CyclicBarrier(int parties, Runnable barrierAction)，如下

public CyclicBarrier(int parties) {
    this(parties, null);
}

public CyclicBarrier(int parties, Runnable barrierAction) {
  if (parties <= 0) throw new IllegalArgumentException();
  this.parties = parties;
  this.count = parties;
  this.barrierCommand = barrierAction;
}

parties参数表示需要到达屏障点的次数，通常与划分出来的子任务的数量一致。调用多少cyclicBarrier对象的await()函数都会认为一个任务到达屏障点，所以这个参数实际上代表的涵义是：需要调用多少次cyclicBarrier对象的await()函数才会认为所有任务都到达了屏障点并触发任务指令。
barrierAction表示任务指令，即所有进行协助的线程都到达屏障点后需要执行的任务操作。这个参数是可选的。

await

CyclicBarrier类中提供了两个await函数，分别是await()和await(long timeout, TimeUnit unit)，如下

public int await() throws InterruptedException, BrokenBarrierException {
  try {
         return dowait(false, 0L);
  } catch (TimeoutException toe) {
         throw new Error(toe); // cannot happen
  }
}
public int await(long timeout, TimeUnit unit)
    throws InterruptedException,
           BrokenBarrierException,
           TimeoutException {
    return dowait(true, unit.toNanos(timeout));
}

从代码可知，这两个函数主要区别在于：一个是无时间限制的同步等待，另一个是有时间限制的同步等待。它们的主要逻辑还是通过dowai函数来实现。

dowait(核心实现)

在了解dowait之间，我们需要了解一个名词：

Generation：一代，在cycylicBarrier的实现逻辑中，以『代』来区分每一次的任务协作，一个任务被完成后，那么就被创建一个新的代。

dowait函数是cyclicBarrier的核心，它主要的处理逻辑顺序是这样的：

使用ReentrantLock获取锁对象
检查当前代是否被破坏或者线程中断，如果满足一个条件，则抛出对应的异常。
paries的副本count进行自减，如果自减等于0，说明当前所有协助任务线程都都已经到达屏幕点，这时候如果barrierCommand不null，就会被触发(PS：barrierCommand由最后一个到达屏障点的线程来执行。如果barrierCommand执行错误，那么就会调用breakBarrier函数标识break为true，并唤醒其他正常阻塞的协作任务线程。否则，调用nextGeneration函数进行重置状态和创建新的代并唤醒其他正常阻塞的协作任务线程，同时为下一次协作做好准备。
paries的副本count如果自减后不等于0，那么表示尚有其他协作线程并到到达屏障点，通过for无限循环进行等待，直至超时或者被其他线程唤醒。唤醒后有两种不同的结果：
- 异常：表示当前这一代的协作任务被标识为break，可能原因为线程中断，barrierCommand执行错误、其他线程超时。
- 正常：当前代已经被更新，说明上一代的任务协作已经正常完成。

具体的细节可以看下边的源码：

private int dowait(boolean timed, long nanos)
        throws InterruptedException, BrokenBarrierException,
               TimeoutException {
        final ReentrantLock lock = this.lock;
        // 获取同步锁
        lock.lock();
        try {
            final Generation g = generation;
                        
                        //判断这一代是否已经被破坏
            if (g.broken)
                throw new BrokenBarrierException();
                        
                        //判断线程是否中断
            if (Thread.interrupted()) {
                breakBarrier();
                throw new InterruptedException();
            }
                        
                        // count自减(count是parties的一个副本)
            int index = --count;
            // 判断count自减后是否等于0
            if (index == 0) {  // tripped
                boolean ranAction = false;
                try {
                        // 如果为0，表示所有线程都到达屏障点，那么触发屏障指令任务。
                    final Runnable command = barrierCommand;
                    if (command != null)
                        command.run();
                    ranAction = true;
                    // 执行nextGeneration，重置状态，准备下次使用;
                    nextGeneration();
                    return 0;
                } finally {
                    if (!ranAction)
                        breakBarrier();
                }
            }
                        
                        // 循环直至以下条件：1、所有线程到达屏幕点，2、当前这一代broken，3、中断、4、超时
            // loop until tripped, broken, interrupted, or timed out
            for (;;) {
                try {
                        // 同步阻塞
                    if (!timed)
                        trip.await();
                    else if (nanos > 0L)
                        nanos = trip.awaitNanos(nanos);
                } catch (InterruptedException ie) {
                    if (g == generation && ! g.broken) {
                        breakBarrier();
                        throw ie;
                    } else {
                        // We're about to finish waiting even if we had not
                        // been interrupted, so this interrupt is deemed to
                        // "belong" to subsequent execution.
                        Thread.currentThread().interrupt();
                    }
                }
                                
                                // 如果这一代被标为broken，那么抛出BrokenBarrierException
                if (g.broken)
                    throw new BrokenBarrierException();
                                // 如果发现代发生了变化，那么表示当前这一代已经完成，返回index，
                                // index表示当前为第parties-index个到达屏障点的线程。
                if (g != generation)
                    return index;
                                // 如果超时，调用breakBarrier并返回TimeoutException
                if (timed && nanos <= 0L) {
                    breakBarrier();
                    throw new TimeoutException();
                }
            }
        } finally {
            lock.unlock();
        }
    }

从dowait的实现逻辑来看，我们可以看出

内部线程间的通讯采用ReentrantLock和Condiction来实现线程音的消息传递。
在协作任务正常返回前，线程中断、BarrierCommand执行异常和线程触发breakBarrier函数都能使CyclicBarrier的dowait提前退出。

barrier的内部状态

在前一个小节中，我们发现dowait的逻辑中会调用nextGentration和breakBarrier函数，这两个函数是cycilcBarrier中更新内部状态和唤醒协作线程的函数，这一节我们主要讲一下barrier内部状态的一个变化过程。

nextGenration

nextGenration函数仅这一代的协作任务正常完成时被调用，通过它来唤醒其他协作线程，并且对barrier进行代的更新。一旦调用nextGenration函数后，generation的引用将被更新，这时候它又可以被重新利用。

private void nextGeneration() {
    // signal completion of last generation
    trip.signalAll();
    // set up next generation
    count = parties;
    generation = new Generation();
}

breakBarrier

breakBarrier函数被调用发生在检测到当前线程中断、等待超时、BarrierCommand执行异常。它的具体逻辑为设置broken标识为true，重置count，然后唤醒其他所有等待线程。

private void breakBarrier() {
    generation.broken = true;
    count = parties;
    trip.signalAll();
}

从实现来看，breakBarrier函数并没有更新generation，结合breakBarrier和dowait的逻辑来看，breakBarrier函数一时被调用，那么barrier就进入了一个broken的状态，它已经不具备重复循环复用的条件，一旦有线程调用dowait，那么它将直接抛出BrokenBarrierException。那么有什么方法让它重新可用呢，那就是调用reset函数。

reset

reset可以重置CyclicBarrier的状态，从来的实现来看，它会先调用breakBarrier，这意味着如果当前barrier有协作任务正在处理，那么将会影响它们的处理结果。在breakBarrier后，会调用nextGeneration来重置内部状态并更新generation，这时候它就变得可重复复用了。

public void reset() {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        breakBarrier();   // break the current generation
        nextGeneration(); // start a new generation
    } finally {
        lock.unlock();
    }
}

总结

CyclicBarrier是一个可重复使用的多线程协作的同步辅助工具，允许一组线程都等待对方都到达一个共同屏障点后执行指定的任务指令。
仅当前一代任务协作正常结束或调用reset方法后，CyclicBarrier才可被两次使用；线程中断、超时以及其他线程调用reset将导致当前CyclicBarrier这一代的状态被破坏。
内部主维护parties的副本count，来判断是否这一代的任务协助是否完成。
多线程协作过程中，主要通过ReentranLock和Condition来实现线程间的状态传递。

CountDownLatch与CyclicBarrier对比

CountDownLatch与CyclicBarrier虽然都是多任务协作的同步辅助工具，但它们之间有一些差异和不同的适用场景。

CountDownLatch是一次性的，CyclicBarrier是可复用的。
CountDownLatch的模型基于条件数，阻塞只发生调用await的线程；CyclicBarrier是模型是基于公共屏障，只要其中一个线程未到达公共屏障，其他协作线程在到达屏障后都会进入阻塞并等待唤醒(所有协作线程都会调用await)。
CountDownLatch主要通过继承aqs框架的内部类Sync来实现，CyclicBarrier通过ReentrantLock和Condition来进行实现。
CountDownLatch的模型协作线程个人认为有角色之分，即一个特殊或多个线程等待其他任务线程达到条件(老板等员工完成任务？？？)；CyclicBarrier的模型的协作线程都是平等的( 都是打工人 : ）)

CountDownLatch And CyclicBarrier个人笔记

CountDownLatch

定义

场景

底层实现

构造函数

内部类Sync

await

countDown

总结

CyclicBarrier

定义

使用场景

底层实现

构造函数

await

dowait(核心实现)

barrier的内部状态

nextGenration

breakBarrier

reset

总结

CountDownLatch与CyclicBarrier对比

VLoye

引用和评论

线上环境CPU使用率高排查笔记

Java8的新特性

Java11的新特性

Java5的新特性

Java9的新特性

Java13的新特性

Java7的新特性