HashMap源码浅析

1 HashMap简介

HashMap 是一个散列表，它存储的内容是键值对(key-value)映射。它继承了AbstractMap，实现了Map、Cloneable、java.io.Serializable接口。

HashMap的实现是不同步的，这意味着线程不安全。并发的环境下建议使用ConcurrentHashMap。

HashMap的key、value都可以为null（除了不同步和允许使用 null 之外，HashMap与 Hashtable大致相同）。此外，HashMap中的映射是无序的。

HashMap 的实例有两个参数影响其性能：“初始容量” 和 “加载因子”。容量是哈希表中桶的数量，初始容量是哈希表在创建时的容量。

loadFactor加载因子是控制数组存放数据的疏密程度，loadFactor越趋近于1，那么数组中存放的数据(entry)也就越多，也就越密，会导致查找元素效率低；loadFactor越小，也就是趋近于0，数组中存放的数据(entry)也就越少，也就越稀疏，但会导致数组的利用率低。

通常，默认加载因子是0.75，这是在时间和空间成本上寻求一种折衷。在设置初始容量时应该考虑到映射中所需的条目数及其

加载因子，以便最大限度地减少 rehash 操作次数。

2 底层数据结构

2.1 JDK1.7

JDK1.7中HashMap是数组+链表结合在一起使用的链表散列。HashMap 定义了扰动函数hash()来减少碰撞，当两个不同元素经过计算发现在数组中的位置一样时，就通过拉链法解决冲突。

所谓 “拉链法” 就是，将链表和数组相结合。也就是说创建一个链表数组，数组中每一格就是一个链表。若遇到哈希冲突，则将冲突的值加到链表中即可。

HashMap在JDK1.7中详细实现可参考深入理解HashMap（jdk7）一文。

2.2 JDK1.8

众所周知，数组的查询效率为O(1)，链表的查询效率是O(n)，红黑树的查询效率是O(log n)，n为桶中的元素个数。

所有当位于链表中的结点过多，显然通过key值依次查找效率就太低了。因此JDK1.8在解决哈希冲突时有了较大的变化，当链表长度大于阈值（默认为8）时，将链表转化为红黑树，以提高查询效率。

也就是说，JDK1.8之后，HashMap底层数据结构是数组+链表+红黑树。

Node节点类源码:

// 继承自 Map.Entry<K,V>
static class Node<K,V> implements Map.Entry<K,V> {
       final int hash;// 哈希值，存放元素到hashmap中时用来与其他元素hash值比较
       final K key;// 键
       V value;// 值
       // 指向下一个节点
       Node<K,V> next;// 链表的next指针
       Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }
        // 重写hashCode()方法
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }
        // 重写 equals() 方法
        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
}

TreeNode节点类源码:

    // 转变为红黑树后的结点类
    static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K,V> parent;  // 父节点
        TreeNode<K,V> left;    // 左子树
        TreeNode<K,V> right;   // 右子树
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;           // 判断颜色
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
        // 返回当前节点的根节点
        final TreeNode<K,V> root() {
            for (TreeNode<K,V> r = this, p;;) {
                if ((p = r.parent) == null)
                    return r;
                r = p;
            }
        }    
        --- omit ---
    }

3 HashMap源码分析（JDK 1.8）

3.1 静态属性

    // 序列号
    private static final long serialVersionUID = 362498820763181265L;    
    // 桶默认的初始容量，2的4次方，即16
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;   
    // 最大容量
    static final int MAXIMUM_CAPACITY = 1 << 30; 
    // 默认的加载因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    // 树化阈值。当上某个桶(bucket)的结点数大于这个值时会转成红黑树
    static final int TREEIFY_THRESHOLD = 8; 
    // 链表还原阈值。当某个桶(bucket)上的结点数小于这个值时树转链表
    static final int UNTREEIFY_THRESHOLD = 6;
    // 桶中链表结构转化为红黑树对应的table的最小容量
    static final int MIN_TREEIFY_CAPACITY = 64;

3.2 成员属性

    // 哈希桶数组
    transient Node<k,v>[] table; 
    // 保存缓存的entrySet
    transient Set<map.entry<k,v>> entrySet;
    // 桶的实际元素个数 != table.length。
    transient int size;
    // 每次扩容和更改map结构 计数器都会+1
    transient int modCount;   
    // 扩容门槛，当实际大小(容量*加载因子)超过扩容门槛时，会进行扩容。是衡量数组是否需扩容的一个标准。
    int threshold;
    // 加载因子
    final float loadFactor;

3.3 构造方法

HashMap 中有四个构造方法，它们分别如下：

    // 默认构造函数。
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
     }
     
     // 调用putMapEntries将Map中的值加入新的Map集合中
     public HashMap(Map<? extends K, ? extends V> m) {
         this.loadFactor = DEFAULT_LOAD_FACTOR;
         putMapEntries(m, false);// 在构造函数使用的时候是false其他时候是true
     }
     
     // 指定“容量大小”的构造函数
     public HashMap(int initialCapacity) {
         this(initialCapacity, DEFAULT_LOAD_FACTOR);
     }
     
     // 指定“容量大小”和“加载因子”的构造函数
     public HashMap(int initialCapacity, float loadFactor) {
         if (initialCapacity < 0)
             throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
         if (initialCapacity > MAXIMUM_CAPACITY)
             initialCapacity = MAXIMUM_CAPACITY;
         if (loadFactor <= 0 || Float.isNaN(loadFactor))
             throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
         this.loadFactor = loadFactor;
         this.threshold = tableSizeFor(initialCapacity);// 扩容门槛为大于initialCapacity的最小二次幂。
     }

可以发现，不论是哪个构造构造方法，loadFactor一定会被初始化。

第二个构造方法是将传入的Map集合元素添加到Map实例中，源码如下：

// 传递的Map集合中的所有元素加入本Map实例中
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
    // 传入Map的元素个数
    int s = m.size();
    if (s > 0) {
        // 判断table是否已经初始化
        if (table == null) {
            // 因为会计算出小数因此+1.0F向上取整
            float ft = ((float)s / loadFactor) + 1.0F;
            // 判断ft是否小于最大容量
            int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                    (int)ft : MAXIMUM_CAPACITY);
            // 计算得到的t大于扩容门槛，则重新计算阈值
            if (t > threshold)
                threshold = tableSizeFor(t);
        }
        // 已初始化，并且m中元素个数大于扩容门槛，进行扩容处理
        else if (s > threshold)
            resize();
        // 遍历，将m中的所有元素添加至HashMap中
        for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
            K key = e.getKey();
            V value = e.getValue();
            putVal(hash(key), key, value, false, evict);
        }
    }
}

3.4 tableSizeFor(int cap)方法

tableSizeFor(int cap) 静态方法是用来计算合理的初始容量，返回大于等于参数 cap的最小 2 次幂。

// 返回大于cap的最小的二次幂数值
static final int tableSizeFor(int cap) {
    int n = cap - 1;
    //  >>> 无符号右移，忽略符号位，空位都以0补齐。对于正数移位来说等同于：>>。
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    // n<0返回1
    // n>最大容量，返回最大容量MAXIMUM_CAPACITY
    // 否则返回n+1
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

这里为什么 cap - 1呢？先来分析有关n位操作部分：

假设n的二进制为01xxx...xxx。

对n右移1位：001xx...xxx，再位或：011xx...xxx（1 与 0 或1 位或的结果都为 1）

对n右移2为：00011...xxx，再位或：01111...xxx

... ...

同理，如果有8个1，右移8位肯定会让后八位也为1。综上可得，该算法让最高位的1后面的位全变为1。

最后再让结果n+1，即得到了2的整数次幂的值了。

回过头再来看int n = cap - 1;，就明白用cap-1赋值给n是为了找出大于或等于原值的目标值。

例如，二进制数0100，即4。如果不进行减1操作，通过运算会等到1000，即8，直接翻倍了，不符合结果。进行减1操作后，二进制数为0011，再进行运算会得到0100，即4。

3.4 确定数组索引位置

不管增加、删除、查找键值对，定位到哈希桶数组的位置都是关键的第一步。

HashMap先是通过扰动函数hash(Object key)处理key的hashCode而得到其hash 值，然后通过 (n - 1) & hash 判断当前元素存放的位置（这里的 n 指的是数组的长度）。

3.4.1 hash(Object)

该方法是 HashMap 的核心静态方法，用于计算 key 的 hash 值。我们在使用HashMap存放数据时，当然希望元素位置分布均匀一点。而使用hash算法计算位置的时，可以直接确定位置，不用遍历链表，大大优化了查询的效率。

JDK1.7的 HashMap 的 hash 方法源码：

static int hash(int h) {
    --- omit ---
    h ^= k.hashCode();
    
    h ^= (h >>> 20) ^ (h >>> 12);
    return h ^ (h >>> 7) ^ (h >>> 4);
}

JDK 1.8 的 hash方法相比于 JDK 1.7 hash 方法更加简化，但是原理不变。（JDK 1.7 的 hash方法的性能会稍差一点点，毕竟扰动了 4 次。）

JDK1.8中 HashMap 的 hash 方法源码：

  // 通过位运算减少 Hash 冲突  
  static final int hash(Object key) {
      int h;
      // key.hashCode()  传入key的散列值
      // 按位异或^，如果相对应位值相同，则结果为0，否则为1            
      // h ^ (h >>> 16)  高位参与运算
      return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

key.hashCode()函数调用的是key键值类型自带的哈希函数public native int hashCode();，返回的hashcode是int类型。如果直接拿散列值做数组下标，那么索引范围就是‑2147483648到2147483648，前后加起来大概40亿的映射空间，很难出现碰撞。问题是默认的初始容量最大才16，这就说明散列值是不能直接用来访问。

在JDK1.7中，散列值使用前需要对数组长度取模运算，到的余数才能用来访问数组下标。源码中模运算是在这个indexFor( )函数里完成。

bucketIndex = indexFor(hash, table.length);

static int indexFor(int h, int length) {
    // 散列值和数组长度做一个“与”操作
    return h & (length-1);
}

位与运算符&运算规则是只有二进制位同时为 1，那么计算结果才为 1，否则为 0。所有说，“与”操作的结果就是将散列值的高位全部归0，只保留低位值用来做数组下标访问。

以初始长度8为例，8-1=7。2进制表示为00000000 00000000 00000111。与某散列值做“与”操作，结果就是截取了最低4位。

        10100101 11000100 00100101
&        00000000 00000000 00000111
----------------------------------    
        00000000 00000000 00000101

在JDK1.8中，putVal() 中寻址部分如下，原理跟上面一样。

tab[i = (n - 1) & hash]

问题来了，就算散列值再松散，总是截取最后几位，碰撞还是会很严重。比如初始长度为16，16-1=15。与某散列值做“与”操作结果跟之前是一样的。也就是说，(n - 1) & hash就是截取hash的最低m位（n=2的m次幂）。

        11110101 10000101 00110100
&        00000000 00000000 00001111
----------------------------------    
        00000000 00000000 00000101

这时候，”扰动函数“的价值就体现出来了。

右位移16位，正好是32的一半，自己的高半区与低半区做异或，就是为了混合原始哈希码的高位与低位，以此来加大低位随机性。而混合后的低位参杂了高位部分特征，高位信息也参入了寻址计算（进行扰动）。

3.4.2 桶下标计算公式

由之前的分析可知，桶下标计算公式即是(capacity - 1) & hash 。之所以不使用hash % capacity方式取模，是因为HashMap中规定了哈希表长度为2 的幂，在这种情况下，位与运算更快， resize() 扩容时也可以更高效地重新计算桶下标。

3.5 put(K,V)

put方法中调用了putVal方法，传递的参数是调用了hash()方法计算key的hash值，主要逻辑写在putVal中。

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 步骤1：桶数组未初始化或者长度为0，进行扩容
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 步骤2：指定桶为空，新生成结点直接放入
    // (n - 1) & hash 计算元素在哪个桶中
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    // 指定位置已经存在元素
    else {
        Node<K,V> e; K k;
        // 步骤3： 如果桶中第一个元素的key与待插入元素的key相同，保存到e中用于后续修改value值
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
                // 将第一个元素赋值给e，用e来记录
                e = p;
        // 步骤4：如果第一个元素是树节点，则调用树节点的putTreeVal插入元素
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 步骤5：为链表结点，遍历链表进行操作
        else {
            // inCount用于存储链表中元素的个数
            for (int binCount = 0; ; ++binCount) {
                // 到达链表的尾部还没有找到相同key的元素，则在尾部插入新结点
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 结点数量达到扩容门槛，转化为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) 
                        treeifyBin(tab, hash);
                    break;
                }
                // 判断链表中结点的key值与插入的元素的key值相等，则退出循环
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                // 用于遍历桶中的链表，与前面的e = p.next组合，可以遍历链表
                p = e;
            }
        }
        // 步骤6：表示在桶中找到key值、hash值与插入元素相等的结点
        if (e != null) { 
            // 记录e的旧value
            V oldValue = e.value;
            // 判断是否要置换旧值
            if (!onlyIfAbsent || oldValue == null)
                // 直接覆盖，并返回旧值
                e.value = value;
            // 访问后回调
            afterNodeAccess(e);
            // 返回旧值
            return oldValue;
        }
    }

    ++modCount;
    // 步骤7：判断是否扩容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

对putVal方法添加元素的分析如下：

如果桶容量为0，则初始化桶。
如果定位到的桶位置没有元素就直接插入元素。
如果定位到的桶位置有元素就和要插入的元素key比较，如果key相同就直接覆盖。
如果定位到的桶位置有元素且与插入的key不相同，就判断是否是一个树节点，如果是就调用e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value)将元素添加进入。
如果不是树节点就遍历链表，判断链表长度是否大于8，大于8的话把链表转换为红黑树，在红黑树中执行插入操作，否则进行链表的插入操作(插入到链表尾部)。
每当插了元素，则实际键值对数量size加1后，需要判断是否扩容。

具体流程如下：

3.6 resize()

进行扩容，会伴随着一次重新hash分配，并且会遍历hash表中所有的元素，是非常耗时的。在编写程序中，要尽量避免resize。

final Node<K,V>[] resize() {
    // 旧数组
    Node<K,V>[] oldTab = table;
    // 旧容量
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    // 旧扩容门槛
    int oldThr = threshold;
    // 新容量，新扩容门槛
    int newCap, newThr = 0;
    // 步骤1：根据旧容量判断是否扩容
    if (oldCap > 0) {
        // 如果旧容量达到了最大容量，则不再进行扩容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 旧容量小于最大容量且大于默认初始容量，就扩容为原来的2倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // 新扩容门槛等于旧扩容门槛的两倍
    }
    // 步骤2：初始化数组时，若是threshold中已经保存初始容量
    else if (oldThr > 0) 
        // 使用 非默认构造方法 ，指定了initialCapacity，threshold被初始化成大于initialCapacity的最小的2的次幂
        // 则用threshold作为table的实际大小
        newCap = oldThr;
    // 步骤3：初始化数组时，threshold中没有保存初始容量
    else { 
        // 调用 默认构造方法 ，未指定initialCapacity，旧容量与旧扩容门槛都是0
        // 说明还未初始化过，则newCap=默认初始化容量（16），新扩容门槛=默认容量*默认加载因子=12
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 步骤4：计算新扩容门槛
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);
    }
    // 将新扩容门槛设为扩容门槛
    threshold = newThr;
    // 步骤5：实例化新table数组
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    // 把原来table里面的值全部搬到新的table里面
    if (oldTab != null) {
        // 步骤6：把每个bucket都移动到新的bucket中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                // 清空Node的引用，便于GC回收
                oldTab[j] = null;
                // 如果旧桶中只有一个元素，直接将它放到新桶中
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                // 桶内部结构为树，则拆分树
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                // 桶内部结构为链表
                else {
                    // 低位链表的头节点与尾节点
                    Node<K,V> loHead = null, loTail = null;
                    // 高位链表的头节点与尾节点
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 循环遍历碰撞节点
                    do {
                        next = e.next;
                        // (e.hash & oldCap) == 0的元素放在低位链表中
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        // (e.hash & oldCap) == 1的元素放在高位链表中
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 遍历完成分化成两个链表
                    // 低位链表放到新table的j位置上，j为旧table中桶的索引，即低位链表位置相对旧表位置不变
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 高位链表放到新table的j+oldCap位置上，即高位表位置相对旧表中位置向右移动oldCap位
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

针对链表的拆分，再进行分析说明一下。需要明确的是：

oldCap一定是2的整数次幂, 这里假设是2^m
newCap是oldCap的两倍, 则会是2^(m+1)
hash对数组大小取模(n - 1) & hash 其实就是取hash的低m位（上面hash()方法有讲到）

以容量oldCap=16扩展为newCap=32为例：

假如在桶的14位置上有两个hash值：

hash1 =  0000 0000 1101 0000 0000 0000 0000 1110
hash2 =  0000 0000 0000 0000 0000 1111 0001 1110

未扩容前桶中位置为：

                        16-1  =  0000 0000 0000 0000 0000 0000 0000 1111
                         hash1 =  0000 0000 1101 0000 0000 0000 0000 1110
(n - 1) & hash          hash2 =  0000 0000 0000 0000 0000 1111 0001 1110
 ------------------------------------------------------------------------
                  (16-1)&hash1 = 0000 0000 0000 0000 0000 0000 0000 1110
                  (16-1)&hash2 = 0000 0000 0000 0000 0000 0000 0000 1110

扩容后在桶中位置为：

                        32-1  =  0000 0000 0000 0000 0000 0000 0001 1111
                         hash1 =  0000 0000 1101 0000 0000 0000 0000 1110
(n - 1) & hash          hash2 =  0000 0000 0000 0000 0000 1111 0001 1110
 ------------------------------------------------------------------------
                  (32-1)&hash1 = 0000 0000 0000 0000 0000 0000 0000 1110 // 1110
                  (32-1)&hash2 = 0000 0000 0000 0000 0000 0000 0001 1110 // 1110 + 10000

可见，在扩充 HashMap 的时候，不需要重新计算 hash值，只需要检查二进制 hash 中与二进制桶下标中新增的有效位的位置相同的那个位（简称“新增位”）是0还是1即可，是0的话索引没变，是1的话索引变成“原索引+oldCap”。

至于新增位是0还是1，可以认为是随机的，这样就均匀的把之前碰撞的节点分散到新旧桶中。

小结：

HashMap扩容会发生在table初始化时。若使用默认构造方法，则第一次插入元素时初始化为默认值，容量为16，扩容门槛为12；如果使用的是非默认构造方法，则第一次插入元素时初始化容量等于扩容门槛，扩容门槛在构造方法里为大于传入容量的最小2的n次幂。
如果扩容时旧容量大于0（不是初始化），则新容量等于旧容量的2倍，但不超过最大容量2的30次方，新扩容门槛为旧扩容门槛的2倍。
每次扩容都会新建一个table，新建的table的大小为原大小的2倍。
扩容时，会将原table中的节点re-hash到新的table中，但节点在新旧table中的位置存在一定联系: 要么下标相同，要么相差一个oldCap(原table的大小).

3.7 get(Object)

public V get(Object key) {
    Node<K,V> e;
    // 该方法返回指定键所映射到的值，如果不包含该键对应的映射关系，则返回 null。
    // 实际上HashMap的键也可以为null，如果需要验证是否真的存在该键对应的映射关系可以调用 containsKey()方法。
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    // 桶的数量不为空且所查询的桶的第一个元素不为空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 查的是桶的第一个元素，直接返回0
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        // 桶中不止一个节点
        if ((e = first.next) != null) {
            // 桶的数据结构是树，则按树的方式查找
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            // 否则遍历整个链表查找该元素
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

可见，查询元素时：

计算key的hash值，根据其找到key所在的桶及桶中第一个元素。
桶中第一个元素的key等于待查找的key，直接返回。
如果通中不止存在一个元素，是树节点就按树的方式来查找；否则遍历整个链表查找该元素。

3.8 treeifyBin(Node<K,V>[] tab, int hash)

上面分析可知，当插入元素时：

if (binCount >= TREEIFY_THRESHOLD - 1) 
    treeifyBin(tab, hash);

链表的长度大于等于8则判断是否需要树化。若当前table数组的容量小于 MIN_TREEIFY_CAPACITY（64）就会选择扩容。

final void treeifyBin(Node<K, V>[] tab, int hash) {
    int n, index;
    Node<K, V> e;
    // 如果当前 table 数组的容量小于 64 就放弃树化，选择扩容。
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)     
        // 因为扩容之后，链表会分化。
        resize();
    else if ((e = tab[index = (n - 1) & hash]) != null) {
        // 链表头节点与尾节点
        TreeNode<K, V> hd = null, tl = null;
        // 把所有节点换成树节点
        do {
            TreeNode<K, V> p = replacementTreeNode(e, null);
            if (tl == null)
                hd = p;
            else {
                p.prev = tl;
                tl.next = p;
            }
            tl = p;
        } while ((e = e.next) != null);
        // 如果进入过上面的循环，则从头节点开始树化
        if ((tab[index] = hd) != null)
            // 调用treeify真正树化
            hd.treeify(tab);
    }
}

3.9 treeify(Node<K,V>[])

        final void treeify(Node<K,V>[] tab) {
            // 定义一个根节点
            TreeNode<K,V> root = null;
            // 遍历已转为树节点的链表
            // x指向当前节点，next指向下一个节点
            for (TreeNode<K,V> x = this, next; x != null; x = next) {
                next = (TreeNode<K,V>)x.next;
                // 初始化当前节点的左子树和右子树，先都为null
                x.left = x.right = null;
                // 如果还未初始化root节点
                if (root == null) {
                    // 就设置当前节点为root节点，并设置是黑节点。
                    x.parent = null;
                    x.red = false;
                    root = x;
                }
                // 已初始化root节点，就开始构建红黑树
                else {
                    K k = x.key;// 获取当前节点的key赋值给k
                    int h = x.hash;// 获取当前节点的哈希值赋值给h
                    Class<?> kc = null;// 定义key所属的Class
                    // 从root节点开始遍历，插入新节点（开始构建红黑树）
                    for (TreeNode<K,V> p = root;;) {
                        // dir标识方向，是在root节点的左侧还是右侧；ph标识当前树节点的hash值
                        int dir, ph;    
                        K pk = p.key;
                        // 比较当前节点的hash值与新节点的hash值
                        // 若是新节点hash值较小                        
                        if ((ph = p.hash) > h)
                            // 标识当前链表节点会放到当前root节点的左侧
                            dir = -1;
                        // 若是新节点的hash值较大
                        else if (ph < h)
                            // 标识当前链表节点会放到当前root节点的右侧
                            dir = 1;
                        // 若是新节点与当前节点的hash值相等
                        else if ((kc == null &&
                                  // 如果新节点的key没有实现Comparable接口
                                  (kc = comparableClassFor(k)) == null) ||
                                 // 或者实现了Comparable接口但是k.compareTo(pk)结果为0
                                 (dir = compareComparables(kc, k, pk)) == 0)
                            // 则调用tieBreakOrder继续比较大小
                            dir = tieBreakOrder(k, pk);

                        TreeNode<K,V> xp = p;
                        
                        // 如果新节点经比较后小于等于当前节点且当前节点的左子节点为null，则插入新节点，反之亦然
                        if ((p = (dir <= 0) ? p.left : p.right) == null) {
                            // 当前链表节点作为当前树节点的子节点
                            x.parent = xp;
                            if (dir <= 0)
                                // 左子树
                                xp.left = x;
                            else
                                 // 右子树
                                xp.right = x;
                            // 平衡红黑树
                            root = balanceInsertion(root, x);
                            break;
                        }
                    }
                }
            }
            // 确保给定的root节点是所在桶的第一个节点
            moveRootToFront(tab, root);
        }

可见，树形化过程如下：

遍历已转为树节点的链表。
如果还未确定根节点，就将桶中的第⼀个元素作为根节点。
确定根节点后，其它元素再依次插入到红黑树中，然后再平衡红黑树。
插入多个元素、经历多次平衡操作后，根节点位置是不确定的，最后需要再将根节点移到链表第一元素的位置。

TreeNode相关操作的其他方法分析可以参考死磕 java集合之HashMap源码分析一文。

4 遍历方式

遍历主要有以下几种：

（1）调用map.entrySet()的集合迭代器

    Map map = new HashMap();
    Iterator<Map.Entry<?, ?>> iter = map.entrySet().iterator();
    while (iter.hasNext()) {
        Map.Entry<?, ?>> entry = iter.next();
        Object key = entry.getKey();
        Object val = entry.getValue();
    }

（2） 调用map.keySet()的集合迭代器

　　Map map = new HashMap();
　　Iterator<?> iter = map.keySet().iterator();
　　while (iter.hasNext()) {
      Object key = iter.next();
      Object val = map.get(key);
　　}

（3）for each map.entrySet()

    Map<?, ?> map = new HashMap<?, ?>();
    for (Entry<?, ?> entry : map.entrySet()) {
        entry.getKey();
        entry.getValue();
    }

（4） for each map.entrySet()，临时变量保存map.entrySet()

    Map<?, ?> map = new HashMap<?, ?>();    
    Set<Entry<?, ?> entrySet = map.entrySet();
    for (Entry<?, ?> entry : entrySet) {
        entry.getKey();
        entry.getValue();
    }

（5）for each map.keySet()

    Map<?, ?> map = new HashMap<?, ?>();
    for (Object key : map.keySet()) {
        map.get(key);
    }

推荐使用第一种方式。

至于其他遍历方式可参考HashMap 的 7 种遍历方式与性能分析！一文。

参考

HashMap源码分析

HashMap(JDK1.8)源码+底层数据结构分析

深入理解HashMap（jdk7）

全网把Map中的hash()分析的最透彻的文章，别无二家

JDK 源码中 HashMap 的 hash 方法原理是什么？

死磕 java集合之HashMap源码分析

深入理解HashMap(四): 关键源码逐行分析之resize扩容

HashMap 的 7 种遍历方式与性能分析！

HashMap源码浅析

1 HashMap简介

2 底层数据结构

2.1 JDK1.7

2.2 JDK1.8

3 HashMap源码分析（JDK 1.8）

3.1 静态属性

3.2 成员属性

3.3 构造方法

3.4 tableSizeFor(int cap)方法

3.4 确定数组索引位置

3.4.1 hash(Object)

3.4.2 桶下标计算公式

3.5 put(K,V)

3.6 resize()

3.7 get(Object)

3.8 treeifyBin(Node<K,V>[] tab, int hash)

3.9 treeify(Node<K,V>[])

4 遍历方式

参考

思思问问

引用和评论

Java12的新特性

Java8的新特性

Java11的新特性

Java5的新特性

Java9的新特性

Java13的新特性

Java7的新特性