ConcurrentHashMap 源码阅读小结

前言

每一次总结都意味着重新开始，同时也是为了更好的开始。ConcurrentHashMap 一直是我心中的痛。虽然不敢说完全读懂了，但也看了几个重要的方法，有不少我觉得比较重要的知识点。

然后呢，放一些楼主写的关于 ConcurrentHashMap 相关源码分析的文章链接：

说起 ConcurrentHashMap ，当然从入口开始说。该方法要点如下：

size 方法不准确，原因是由于并发插入，baseCount 难以及时更新。计数盒子也难以及时更新。
内部通过两个变量，一个是 baseCount，一个是 counterCells，counterCells 是并发修改 baseCount 后的备用方案。
具体更新 baseCount 和 counterCells 是在 addCount 方法中。备用方法 fullAddCount 则会死循环插入。
CounterCell 是一个用于分配计数的填充单元，改编自 LongAdder和Striped64。内部只有一个 volatile 的 value 变量，同时这个类标记了 @sun.misc.Contended ，这是一个避免伪共享的注解，用于替代之前的缓存行填充。多线程情况下，注解让性能提升 5 倍。

该方法会根据 CPU 核心数平均分配给每个 CPU 相同数量的桶。但如果不够 16 个，默认就是 16 个。
扩容是按照 2 倍进行扩容。
每个线程在处理完自己领取的区间后，还可以继续领取，如果有的话。这个是 transferIndex 变量递减 16 实现的。
每次处理空桶的时候，会插入一个 forward 节点，告诉 putVal 的线程：“我正在扩容，快来帮忙”。但如果只有 16 个桶，只能有一个线程扩容。
如果有了占位符，那就不处理，跳过这个桶。
如果有真正的实际值，那就同步头节点，防止 putVal 那里并发。
同步块里会将链表拆成两份，根据 hash & length 得到是否是 0，如果是0，放在低位，反之，反之放在 length + i 的高位。这里的设计是为了防止下次取值的时候，hash 不到正确的位置。
如果该桶的类型是红黑树，也会拆成 2 个，这是必须的。然后判断拆分过的桶的大小是否小于等于 6，如果是，改成链表。
线程处理完之后，如果没有可选区间，且任务没有完成，就会将整个表检查一遍，防止遗漏。

ConcurrentHashMap 满是财富，都是精华代码，我们这次阅读只是管中窥豹，要知道其中包含 53 个类，6300 行代码，但这次确实收获很多。有时间一定再次阅读！！

能力不高，水平有限，有些地方确实理解不了 Doug Lea 大师的设计，如果有什么错误，还请大家指出。不胜感激。