首页

当前位置：网站首页 > 技术资源 > 正文

「一文搞懂」ConcurrentHashMap实现原理及源码解析

lipiwang 2024-11-06 19:39 6 浏览 0 评论

本章内容

简介

ConcurrentHashMap是Java并发包（JUC）中提供的一种线程安全的并发容器（即：HashMap的线程安全版本），主要用于高并发场景下key-value数据的存储。

实现原理

ConcurrentHashMap的实现原理在JDK的不同版本中存在很大的差异：

在JDK1.7版本中，ConcurrentHashMap通过数组+Segment分段锁+链表的方式实现，通过Segment分段锁（Segment继承了ReentrantLock）来保证并发场景下多线程操作的并发安全性。
在JDK1.8版本中，ConcurrentHashMap通过数组+链表+红黑树的方式实现，通过CAS+synchronized来保证并发场景下多线程操作的并发安全性。

本文主要分享ConcurrentHashMap在JDK1.8版本中的实现原理。

整体结构

ConcurrentHashMap的整体结构，如图所示：

其中：

数组：Node类型的数组，数组中的每个元素相当于一个哈希桶：

如果不发生哈希冲突，则每个元素都存储在数组中。
如果发生哈希冲突，则每个元素存储的是链表的头节点或红黑树的根节点。

链表：Node类型的链表，当发生哈希冲突时，通过链地址法将具有相同哈希值的Node节点组成一个链表。
红黑树：当链表的长度大于8且数组的长度大于等于64时，将链表转换为红黑树进行存储。

重要属性

ConcurrentHashMap的重要属性及常量：

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
    implements ConcurrentMap<K,V>, Serializable {
    // Node数组，用于存储ConcurrentHashMap中的数据
    transient volatile Node<K,V>[] table;
    // 扩容时产生的新的Node数组，其容量为table数组的2倍
    private transient volatile Node<K,V>[] nextTable;
    /**
     * sizeCtl值：
     *   0：表示数组未初始化，且数组的初始容量为16
     *   正数：如果数组未初始化，则该值记录的是数组的初始容量；如果数组已经初始化，则该值记录的是数组的扩容阈值（数组初始容量*0.75）
     *   -1：表示数组正在进行初始化
     *   -N：表示数组正在进行扩容，参与扩容的线程数为N-1
     */
    private transient volatile int sizeCtl;
    // Node数组最大容量
    private static final int MAXIMUM_CAPACITY = 1 << 30;
    // Node数组默认容量
    private static final int DEFAULT_CAPACITY = 16;
    // 扩容因子
    private static final float LOAD_FACTOR = 0.75f;
    /**
     * 链表转红黑树阀值：
     *   如果链表长度大于达到阀值，但数组容量小于64，则进行数组扩容。
     *   如果链表长度大于达到阀值，且数组容量大于等于64，则将链表转为红黑树。
     */
    static final int TREEIFY_THRESHOLD = 8;
    // 红黑树转链表阀值，如果红黑树中的节点个数达到阀值，则将红黑树转为链表。
    static final int UNTREEIFY_THRESHOLD = 6;
    // 链表转红黑树数组容量最小值
    static final int MIN_TREEIFY_CAPACITY = 64;
}

重要结构

Node

Node节点主要用于封装key-value键值对，ConcurrentHashMap中的链表由多个相连的Node节点组成。

static class Node<K,V> implements Map.Entry<K,V> {
    // key的hash值
    final int hash;
    // key键
    final K key;
    // value值
    volatile V val;
    // 指向下一个Node节点的指针
    volatile Node<K,V> next;
    ...
}

ForwardingNode

ForwardingNode主要用于数组进行扩容时标识哈希桶对应的头节点，ForwardingNode中不保存key-value键值对，只保存扩容时产生的新的Node数组（nextTable）的引用。ForwardingNode中的hash值为MOVED（-1），它定义了一个find()方法，用于扩容时从nextTable中查找对应的Node节点。

TreeBin

当ConcurrentHashMap中的链表转为红黑树后，数组中保存的引用为TreeBin，TreeBin内部不保存key-value键值对，而是保存TreeNode的List和红黑树Root。

TreeNode

红黑树的节点，TreeNode继承了ConcurrentHashMap.Node。

构造函数

ConcurrentHashMap的构造函数：

// 无参构造函数
public ConcurrentHashMap() {}
// 带初始化容量的构造函数
public ConcurrentHashMap(int initialCapacity) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException();
    /**
     * 如果数组的初始容量大于(最大容量/2），则初始化容量大小为最大容量。
     * 否则初始化容量大小为大于(initialCapacity+initialCapacity/2+1)的最小2^n值。
     * 假设initialCapacity为8，则大于(8+8/2+1)的最小2^n为16，即：cap = 16
     */
    int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
               MAXIMUM_CAPACITY :
               tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
    // 设置sizeCtl变量的值为数组的初始化容量
    this.sizeCtl = cap;
}
// 带集合的构造函数
public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
    // 设置sizeCtl变量的值为数组的默认容量
    this.sizeCtl = DEFAULT_CAPACITY;
    // 将集合中所有的key-value键值对添加到ConcurrentHashMap中
    putAll(m);
}
// 带初始化容量和负载因子的构造函数
public ConcurrentHashMap(int initialCapacity, float loadFactor) {
    this(initialCapacity, loadFactor, 1);
}
// 带初始化容量、负载因子以及并发线程数的构造函数
public ConcurrentHashMap(int initialCapacity,
                         float loadFactor, int concurrencyLevel) {
    if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
        throw new IllegalArgumentException();
    // 如果初始容量小于并发线程数，则初始容量为并发线程数的大小
    if (initialCapacity < concurrencyLevel) 
        initialCapacity = concurrencyLevel; 
    // 数组大小
    long size = (long)(1.0 + (long)initialCapacity / loadFactor);
    /**
     * 如果数组大小大于等于最大容量，则初始化容量大小为最大容量。
     * 否则初始化容量大小为大于size的最小2^n值。
     */
    int cap = (size >= (long)MAXIMUM_CAPACITY) ?
        MAXIMUM_CAPACITY : tableSizeFor((int)size);
    // 设置sizeCtl变量的值为数组的初始化容量
    this.sizeCtl = cap;
}

put方法

实现原理

ConcurrentHashMap通过ConcurrentHashMap#put方法向其中添加key-value键值对。

ConcurrentHashMap#put方法执行流程，如图所示：

处理流程：

1）向ConcurrentHashMap中添加key-value键值对，计算key对应的hash值，自旋遍历table数组并进行判断：

如果table数组还未初始化，则初始化table数组。
如果key的hash值对应的数组下标处不存在Node节点，则根据key的hash值、key、value等值创建Node节点，并将创建的Node节点通过CAS的方式设置到hash值对应的数组下标处，退出自旋。
如果key的hash值对应的数组下标处存在Node节点，且Node节点的hash值为-1（即：ForwardingNode），说明正在进行数组扩容，则当前线程协助数组扩容，直到数组扩容完成，继续自旋。
如果key的hash值对应的数组下标处存在Node节点，且Node节点的hash值不为-1（即：正常的Node节点），则锁定该下标对应的哈希槽，并根据哈希槽中头节点类型进行判断：

如果节点类型为Node，说明哈希槽存储的是链表，则遍历链表并进行判断：

如果存在与key的hash值及key值相等的节点，则根据onlyIfAbsent值进行判断：

true：退出链表遍历。
false：用传入的value替换旧value，退出链表遍历。

如果不存在与key的hash值及key值相等的节点，则根据key的hash值、key、value等值创建Node节点并追加到链表的末尾（尾插法），退出链表遍历。

如果节点类型为TreeBin，说明哈希槽存储的是红黑树，则遍历红黑树并进行判断：

如果存在与key的hash值及key值相等的节点，则根据onlyIfAbsent值进行判断：

true：不做处理。
false：用传入的value替换旧value。

如果不存在与key的hash值及key值相等的节点，则根据key的hash值、key、value等值创建TreeNode节点添加到红黑树中。

判断binCount的值是否为0：

0：表示添加失败，继续自旋。
非0：表示添加成功，链表中的节点数是否达到8个：

节点数达到8个：如果table数组大小达到64，则将链表转为红黑树；否则进行数组扩容。

旧value是否为空：

不为空，则返回旧value。

2）增加节点总数，并返回null。

源码解析

ConcurrentHashMap#put方法源码解析：

public V put(K key, V value) {
    // 添加key-value键值对
    return putVal(key, value, false);
}
/**
 * 添加key-value键值对具体实现
 */
final V putVal(K key, V value, boolean onlyIfAbsent) {
    // 如果key或者value为空，则抛出空指针异常
    if (key == null || value == null) throw new NullPointerException();
    // 计算key的hash值
    int hash = spread(key.hashCode());
    int binCount = 0;
    // 自旋遍历table数组
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        // 如果table数组未初始化，则初始化table数组
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        // 如果根据key的hash值计算得到的数组下标（i）处不存在对应的Node节点，则根据key的hash值、key、value等值创建新的Node节点，并以CAS的方式将新创建的Node节点添加到数组对应的下标处
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // 通过CAS的方式在下标i处创建Node节点
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        // 如果Node节点的hash值为MOVED（-1），说明正在进行数组扩容，则协助数组扩容，直到数组扩容完成
        else if ((fh = f.hash) == MOVED)
            // 协助数组扩容
            tab = helpTransfer(tab, f);
        else {  // 此处表示根据key的hash值计算得到的数组下标（i）处已经存在对应的Node节点
            V oldVal = null;
            // 锁定该下标对应的哈希槽
            synchronized (f) {
                // 判断数组下标i处的Node节点是否被修改
                if (tabAt(tab, i) == f) {
                    // f节点的hash值大于等于0，说明是正常的Node节点（非转移节点）
                    if (fh >= 0) {
                        // 链表中已遍历的节点数
                        binCount = 1;
                        // 遍历链表
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            /** 
                             * 如果存在与key的hash值及key值相等的节点，则根据onlyIfAbsent值进行判断：
                             *   true：退出链表遍历，继续自旋。
                             *   false：用传入的value替换旧value，退出链表遍历，继续自旋。
                             */
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                // onlyIfAbsent为false，则用传入的value替换旧value
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            // 如果不存在与key的hash值及key值相等的节点，则根据key的hash值、key、value等值创建Node节点并追加到链表的末尾（尾插法）
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    // 如果根据key的hash值计算得到的数组下标（i）处存放的是红黑树，则根据key的hash值、key、value等值创建TreeNode节点并添加到红黑树中
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            // binCount不等于0，说明已经添加成功
            if (binCount != 0) {
                // 如果binCount大于等于8，则将链表转化为红黑树
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    addCount(1L, binCount);
    return null;
}

table数组初始化

ConcurrentHashMap中的table数组采用懒加载方式进行初始化。调用ConcurrentHashMap#initTable方法进行table数组初始化时，首先通过自旋来保证初始化成功，然后通过CAS的方式将SizeCtl变量的值设置为-1（-1表示数组正在进行初始化）来保证同一时刻只有一个线程对数组进行初始化，CAS成功后，再次判断当前数组是否已经初始化完成，如果已经初始化完成，则不会再次初始化。通过自旋+CAS+双重检查等手段保证了数组初始化时的线程安全。

ConcurrentHashMap#initTable方法源码解析：

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    // 如果table数组未初始化，则自旋进行初始化
    while ((tab = table) == null || tab.length == 0) {
        // sizeCtl小于0，说明存在其他线程正在进行初始化，则让出CPU使用权
        if ((sc = sizeCtl) < 0)
            // 让出CPU使用权
            Thread.yield(); // lost initialization race; just spin
        // 通过CAS的方式将sizeCtl的值更新为-1（-1表示数组正在进行初始化）
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                // 双重检查，再次判断table数组是否初始化
                if ((tab = table) == null || tab.length == 0) {
                    // table数组容量：如果sc大于0，则设置sc的值为table数组的初始容量，否则设置table数组的初始容量为默认值（16）
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    // 创建Node类型的数组，并赋值给table变量
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    table = tab = nt;
                    // 设置sc的值为table数组初始容量的3/4（即：75%）
                    sc = n - (n >>> 2);
                }
            } finally {
                // 将sc的值赋给sizeCtl变量，初始化完成
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

根据key的hash值计算数组下标

根据key的hash值计算方法：

static final int spread(int h) {
    // h ^ (h >>> 16)：高位运算，即：key.hashCode()的高16位异或低16位
    return (h ^ (h >>> 16)) & HASH_BITS;
}

其中，参数h为key调用hashCode()方法得到的值。

假设数组长度为16，数组下标计算过程，如图所示：

协助扩容

在put方法中，通过遍历table数组中的Node节点向ConcurrentHashMap中添加key-value键值对时，如果key的hash值对应的数组下标处的头节点为ForwardingNode节点（即：节点中的hash值为-1），说明正在进行数组扩容，则通过调用ConcurrentHashMap#helpTransfer方法协助数组扩容，直到数组扩容完成。

ConcurrentHashMap#helpTransfer方法源码解析：

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
    Node<K,V>[] nextTab; int sc;
    // 如果table数组不为空且Node节点类型为ForwardingNode节点，并且ForwardingNode节点的nextTable引用不为空，则协助数组扩容
    if (tab != null && (f instanceof ForwardingNode) &&
        (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
        // 获取扩容标识
        int rs = resizeStamp(tab.length);
        // 自旋，其中sizeCtl<0表示正在进行数组扩容
        while (nextTab == nextTable && table == tab &&
               (sc = sizeCtl) < 0) {
            /**
             * 满足以下四个条件，则退出自旋（即：不执行扩容操作）
             * 条件1：当前线程获取的扩容标识是否与通过sc计算出来的扩容标识一致，不一致则退出循环
             * 条件2：默认第一个线程设置为sc==(rs<<16)+2，当第一个线程扩容结束sc的值-1，即：sc==(rs<<16)+1，表示扩容结束
             * 条件3：当前协助扩容的线程数达到最大值
             * 条件4：转移下标小于0，表示扩容完成
             */
            if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                sc == rs + MAX_RESIZERS || transferIndex <= 0)
                break;
            // 通过CAS的方式将sizeCtl变量的值+1，更新成功则执行数据转移
            if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
                // 执行数据转移
                transfer(tab, nextTab);
                break;
            }
        }
        // 返回扩容后的数组
        return nextTab;
    }
    return table;
}

get方法

实现原理

ConcurrentHashMap通过ConcurrentHashMap#get方法获取key对应的value值。

ConcurrentHashMap#get方法执行流程，如图所示：

处理流程：

根据key从ConcurrentHashMap中获取value值，计算key对应的hash值，根据table数组及hash值对应的数组下标处是否存在节点进行判断：

如果数组为空或者hash值对应的下标处不存在节点，则返回null。
如果数组不为空且hash值对应的下标处存在节点：

继续判断头节点的hash值以及key值是否与传入key的hash值以及key值相等：

相等，则返回头节点的value值。

头节点的hash值与传入key的hash值不相等且头节点的hash值小于0：

头节点的hash值为-1：从nextTable数组（扩容后的数组）中查询，并返回查询结果。
头节点的hash值为-2：从红黑树中查询，并返回查询结果。

头节点的hash值与传入key的hash值不相等且头节点的hash值大于等于0，则遍历key的hash值对应的数组下标处的链表：

存在与key值相等的节点，则返回节点的value值。
不存在与key值相等的节点，则返回null。

源码解析

ConcurrentHashMap#get方法源码解析：

public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    // 计算key的hash值
    int h = spread(key.hashCode());
    // table数组不为空且key的hash值对应的数组下标处存在节点
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        // 如果头节点的hash值与key的hash相等，则继续判断头节点的key值与传入的key值相等
        if ((eh = e.hash) == h) {
            // 如果头节点的key值与传入key值相等，则返回头节点的value值
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        /**
         * 如果key的hash值对应的数组下标处的头节点hash值小于0，说明正在进行数组扩容，则从nextTable数组（扩容后的数组）中查找key对应的value值
         * 根据eh的值分两种情况：
         *   1）-1：表示ForwardingNode，调用ForwardingNode中的find()方法
         *   2）-2：表示TreeBin，调用TreeBin中的find()方法
         */
        else if (eh < 0)
            return (p = e.find(h, key)) != null ? p.val : null;
        // 如果key的hash值对应的数组下标处的头节点的key与key不相等，则遍历链表查找key对应的value值
        while ((e = e.next) != null) {
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    // 没有找到key对应的节点，则返回null
    return null;
}

扩容机制

实现原理

当table数组中保存的数据越来越多，数组中的空位会越来越少，从而导致添加数据时hash冲突增加，最终导致数组中的链表越来越长，降低数据查询效率。

为了防止数组中的链表过长，提高数据查询效率，ConcurrentHashMap引入了扩容机制。扩容操作并不是在数组中没有空位时才进行，当数组中已使用的哈希槽位达到扩容因子设定的比例（默认：0.75）时，就会触发对数组进行扩容操作，扩容后的数组容量为table数组的2倍。

扩容操作通过ConcurrentHashMap#tryPresize方法实现，整体流程如图所示：

处理流程：

1）设置扩容后数组容量为table数组容量的2倍。
2）判断table数组是否初始化：

未初始化，则初始化table数组。
已初始化，则判断table数组已扩容或数组大小达到最大值：

是则不执行扩容操作。
否则执行扩容操作。

3）根据sizeCtl变量值进行判断：

sizeCtl变量值小于0，说明其他线程正在进行数组扩容，则以CAS的方式将sizeCtl变量值+1，协助数组扩容。
sizeCtl变量值大于等于0，说明当前数组为第一个参与数组扩容的线程。

4）开始数据转移，根据table数据容量及CPU核数设置当前线程负责转移的哈希槽。并根据哈希槽中节点的hash值判断：

hash值大于等于0，则转移链表中的数据。
hash值小于0，则转移红黑树中的数据。

5）根据节点hash值&数组扩容位的结果（二进制与操作的结果）进行判断：

如果与操作结果为0，则数据转移后在新数组中的位置保持不变。
如果与操作结果为1，则数据转移后在新数组中的位置保持为原来位置+table数组容量。

6）设置哈希槽点头节点为ForwardingNode（表示正在进行数组扩容）。
7）当前线程负责的哈希槽数据转移完成，判断table数组中的所有数据是否转移完成：

否，则通过CAS的方式将sizeCtl变量的值-1，当前线程是否为最后一个扩容线程：

否，退出扩容操作。
是，设置转移完成标志，下次循环执行table数组中的所有数据转移完成操作。

是，则清空nextTable数组，设置table数组为扩容后的数组，设置sizeCtl的值为table数组容量的0.75倍。

扩容时二进制与操作

假设扩容前table数组容量为16，扩容后nextTable数组容量为32。

转移过程如图所示：

图中，table数组容量与nextTable数组容量的区别是二进制值中将第5位的值设置为1，即：将table数组容量向左移动一位得到nextTable数组容量。其中：

key1值的第5位为1，扩容后的值为扩容前的值+table数组容量（即：18）。
key2值的第5位为0，扩容后的值保持不变（即：5）。

源码解析

ConcurrentHashMap#tryPresize方法源码解析：

private final void tryPresize(int size) {
    // 设置变量c为扩容后的数组容量为table数组的2倍，最大不超过MAXIMUM_CAPACITY值
    int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
        tableSizeFor(size + (size >>> 1) + 1);
    int sc;
    // 如果sizeCtl的值大于等于0，则自旋
    while ((sc = sizeCtl) >= 0) {
        Node<K,V>[] tab = table; int n;
        // 如果table数组未初始化，则初始化table数组
        if (tab == null || (n = tab.length) == 0) {
            // 设置n值为sizeCtl和变量c中的较大值
            n = (sc > c) ? sc : c;
            // 以CAS的方式设置sizeCtl的值为-1，表示正在进行数组初始化
            if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if (table == tab) {
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = nt;
                        // 设置变量sc的值为table数组容量的75%
                        sc = n - (n >>> 2);
                    }
                } finally {
                    // 将变量sc的值赋值给sizeCtl变量（即：sizeCtl的值为table数组容量的75%）
                    sizeCtl = sc;
                }
            }
        }
        // 如果数组已经扩容或者table数组的容量达到最大作，则退出自旋（即：不执行扩容操作）
        else if (c <= sc || n >= MAXIMUM_CAPACITY)
            break;
        // 执行扩容操作
        else if (tab == table) {
            // 获取扩容标识
            int rs = resizeStamp(n);
            // 如果sizeCtl的值小于0，说明正在进行数组扩容，则协助数组扩容
            if (sc < 0) {
                Node<K,V>[] nt;
                /**
                 * 满足以下四个条件，则退出自旋（即：不执行扩容操作）
                 * 条件1：当前线程获取的扩容标识是否与通过sc计算出来的扩容标识一致，不一致则退出循环
                 * 条件2：默认第一个线程设置为sc==(rs<<16)+2，当第一个线程扩容结束sc的值-1，即：sc==(rs<<16)+1，表示扩容结束
                 * 条件3：当前协助扩容的线程数达到最大值
                 * 条件4：转移下标小于0，表示扩容完成
                 */
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                // 通过CAS的方式将sizeCtl变量的值+1，更新成功则执行数据转移
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    // 执行数据转移
                    transfer(tab, nt);
            }
            // 此处表示当前线程为第一个扩容线程，则nextTable数组传null（会在数据转移时新建一个容量为table数组2被的数组）
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                // 执行数据转移，注意：此处nextTable数组传null
                transfer(tab, null);
        }
    }
}
// 执行数据转移方法
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
    int n = tab.length, stride;
    /**
     * stride变量表示每个线程进行数据转移时负责的哈希槽数
     * 计算规则：
     *   如果CPU核数大于1，则每个线程负责的哈希槽数为table数组容量/8
     *   如果CPU核数等于1，则该线程负责整个table数组的所有哈希槽
     *   每个消息负责的哈希槽数最少为16个
     */
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
        stride = MIN_TRANSFER_STRIDE; // subdivide range
    // 如果传入的nextTable数组为空，则创建nextTable数组，容量为table数组的2倍
    if (nextTab == null) {            // initiating
        try {
            @SuppressWarnings("unchecked")
            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
            nextTab = nt;
        } catch (Throwable ex) {      // try to cope with OOME
            sizeCtl = Integer.MAX_VALUE;
            return;
        }
        nextTable = nextTab;
        // 当前线程进行数据转移的哈希槽区间
        transferIndex = n;
    }
    int nextn = nextTab.length;
    // 创建ForwardingNode节点，并设置nextTable属性为nextTable数组的引用
    ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
    // 标识某个哈希槽中的数据是否完成转移，true-表示转移完成，开启下一个哈希槽转移
    boolean advance = true;
    // 标识table数组中的数据是否完成转移，true-表示转移完成
    boolean finishing = false; // to ensure sweep before committing nextTab
    // 开始转移某个哈希槽中的数据，i-表示当前需要转移的哈希槽，bound-表示需要转移的哈希槽边界
    for (int i = 0, bound = 0;;) {
        Node<K,V> f; int fh;
        /**
         * 根据哈希槽的转移情况设置变量i和bound
         * i：transferIndex-1
         * bound：transferIndex-stride
         */
        while (advance) {
            int nextIndex, nextBound;
            if (--i >= bound || finishing)
                advance = false;
            else if ((nextIndex = transferIndex) <= 0) {
                i = -1;
                advance = false;
            }
            // 以CAS的方式设置transferIndex = transferIndex - stride
            else if (U.compareAndSwapInt
                     (this, TRANSFERINDEX, nextIndex,
                      nextBound = (nextIndex > stride ?
                                   nextIndex - stride : 0))) {
                bound = nextBound;
                i = nextIndex - 1;
                advance = false;
            }
        }
        // 当前线程负责的哈希槽数据转移完成
        if (i < 0 || i >= n || i + n >= nextn) {
            int sc;
            // table数组的所有数据转移完成
            if (finishing) {
                // 清空nextTable数组
                nextTable = null;
                // 设置table数组为扩容后的数组
                table = nextTab;
                // 设置sizeCtl的值为table数组容量的0.75倍
                sizeCtl = (n << 1) - (n >>> 1);
                return;
            }
            // 通过CAS的方式将sizeCtl变量的值-1
            if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                // 如果当前线程不是本次执行扩容操作的最后一个转移线程，则退出
                if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                    return;
                finishing = advance = true;
                i = n; // recheck before commit
            }
        }
        // 如果当前哈希槽中不存在节点，则设置哈希槽的头节点为ForwardingNode节点
        else if ((f = tabAt(tab, i)) == null)
            advance = casTabAt(tab, i, null, fwd);
        // 如果当前哈希槽中的数据已经转移完成，则设置advance为true
        else if ((fh = f.hash) == MOVED)
            advance = true; // already processed
        // 当前哈希槽中的数据未转移完成，则继续转移数据
        else {
            // 锁定当前哈希槽
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    Node<K,V> ln, hn;
                    // 节点的hash值大于0，说明转移的事链表中的数据
                    if (fh >= 0) {
                        int runBit = fh & n;
                        Node<K,V> lastRun = f;
                        for (Node<K,V> p = f.next; p != null; p = p.next) {
                            int b = p.hash & n;
                            if (b != runBit) {
                                runBit = b;
                                lastRun = p;
                            }
                        }
                        if (runBit == 0) {
                            ln = lastRun;
                            hn = null;
                        }
                        else {
                            hn = lastRun;
                            ln = null;
                        }
                        for (Node<K,V> p = f; p != lastRun; p = p.next) {
                            int ph = p.hash; K pk = p.key; V pv = p.val;
                            // 根据节点的哈希值与n的结果是否为0将链表拆分为两个子链表
                            if ((ph & n) == 0)
                                ln = new Node<K,V>(ph, pk, pv, ln);
                            else
                                hn = new Node<K,V>(ph, pk, pv, hn);
                        }
                        // (ph & n)==0，将链表中的节点设置到ln链表中，ln链表保存转移后在新数组中位置保持不变的节点
                        setTabAt(nextTab, i, ln);
                        // (ph & n)!=0，将链表中的节点设置到hn链表中，hn链表保存转移后在新数组中位置为i+n的节点
                        setTabAt(nextTab, i + n, hn);
                        // 设置哈希槽点头节点为ForwardingNode
                        setTabAt(tab, i, fwd);
                        advance = true;
                    }
                    // 转移红黑树中的数据
                    else if (f instanceof TreeBin) {
                        TreeBin<K,V> t = (TreeBin<K,V>)f;
                        TreeNode<K,V> lo = null, loTail = null;
                        TreeNode<K,V> hi = null, hiTail = null;
                        int lc = 0, hc = 0;
                        for (Node<K,V> e = t.first; e != null; e = e.next) {
                            int h = e.hash;
                            TreeNode<K,V> p = new TreeNode<K,V>
                                (h, e.key, e.val, null, null);
                            if ((h & n) == 0) {
                                if ((p.prev = loTail) == null)
                                    lo = p;
                                else
                                    loTail.next = p;
                                loTail = p;
                                ++lc;
                            }
                            else {
                                if ((p.prev = hiTail) == null)
                                    hi = p;
                                else
                                    hiTail.next = p;
                                hiTail = p;
                                ++hc;
                            }
                        }
                        ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                            (hc != 0) ? new TreeBin<K,V>(lo) : t;
                        hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                            (lc != 0) ? new TreeBin<K,V>(hi) : t;
                        setTabAt(nextTab, i, ln);
                        setTabAt(nextTab, i + n, hn);
                        setTabAt(tab, i, fwd);
                        advance = true;
                    }
                }
            }
        }
    }
}

常见问题

为什么数组大小必须为2的n次方？

将数组设置为2的n次方主要为了减少哈希碰撞的概率。

假设向ConcurrentHashMap中添加key为16、17、18三个key-value键值对，16、17、18三个key的二进制值为10000、10001、10010：

如果数组大小不是2的n次方，如：数组大小为21，那么数组大小-1为20，其二进制值为10100，分别与16、17、18的二进制值进行&运算后的结果都是10000。
如果数组大小是2的n次方，如：数组大小为2^4，那么数组大小-1为15，其二进制值为1111，分别与16、17、18的二进制值进行&运算后的结果为0000、0001、0010。

通过对比，将数组设置为2的n次方显然减少了哈希碰撞的概率。

为什么查询数组下标时使用按位与（&）操作？

使用按位与操作的原因是按位与操作更高效。如：数组扩容时通过按位与进行数据迁移。

使用示例

/**
 * @author 南秋同学
 * ConcurrentHashMap使用示例
 */
@Slf4j
public class ConcurrentHashMapExample {
    private static ConcurrentHashMap<String, AtomicInteger> count = new ConcurrentHashMap();
    private static CountDownLatch  countDownLatch = new CountDownLatch(3);
    public static void main(String[] args) {
        Runnable task = new Runnable() {
            @Override
            public void run() {
                AtomicInteger old;
                for (int i = 0; i < 10; i++) {
                    old = count.get("南秋同学");
                    if (null == old) {
                        AtomicInteger zero = new AtomicInteger(0);
                        old = count.putIfAbsent("南秋同学", zero);
                        if (null == old) {
                            old = zero;
                        }
                    }
                    old.incrementAndGet();
                }
                countDownLatch.countDown();
            }
        };
        new Thread(task).start();
        new Thread(task).start();
        new Thread(task).start();
        try {
            countDownLatch.await();
            log.info("count:{}",count);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

concurrenthashmap

上一篇：还不懂 ConcurrentHashMap ?这份源码分析了解一下
下一篇：Java ConcurrentHashmap 解析 concurrenthashmap jdk1.8原理

「一文搞懂」ConcurrentHashMap实现原理及源码解析

本章内容

简介

实现原理

整体结构

重要属性

重要结构

Node

ForwardingNode

TreeBin

TreeNode

构造函数

put方法

实现原理

源码解析

get方法

实现原理

源码解析

扩容机制

实现原理

扩容时二进制与操作

源码解析

常见问题

使用示例

相关推荐

取消回复欢迎你发表评论:

深圳尚学堂Java面试习题集(六)

MySQL 日期操作函数大全:解锁时间处理的奥秘

Android 工程师必知必会的“AOP知识”

SpringBoot-24-默认Json框架jackson详解

工作3年出去面试Java，被鄙视spring的接口有哪些都不清楚

互联网应用高并发中间件:RabbitMQ的安装和配置

SQLMAP注入参数-其他参数介绍 sqlmap怎么对一个注入点注入

JavaScript:如何优雅的创建数组?

JavaScript代码怎样引入到HTML中?

魔兽世界TBC怀旧服:风暴要塞王子一键救人宏，简单又实用

「一文搞懂」ConcurrentHashMap实现原理及源码解析

本章内容

简介

实现原理

整体结构

重要属性

重要结构

Node

ForwardingNode

TreeBin

TreeNode

构造函数

put方法

实现原理

源码解析

get方法

实现原理

源码解析

扩容机制

实现原理

扩容时二进制与操作

源码解析

常见问题

使用示例

相关推荐

取消回复欢迎 你 发表评论:

深圳尚学堂Java面试习题集(六)

MySQL 日期操作函数大全:解锁时间处理的奥秘

Android 工程师必知必会的“AOP知识”

SpringBoot-24-默认Json框架jackson详解

工作3年出去面试Java，被鄙视spring的接口有哪些都不清楚

互联网应用高并发中间件:RabbitMQ的安装和配置

SQLMAP注入参数-其他参数介绍 sqlmap怎么对一个注入点注入

JavaScript:如何优雅的创建数组?

JavaScript代码怎样引入到HTML中?

魔兽世界TBC怀旧服:风暴要塞王子一键救人宏，简单又实用

取消回复欢迎你发表评论: