ConcurrentHashMap 原理分析

ConcurrentHashMap 原理分析

简介

java 中,hash 表总共有hashmap, hashtable,concurrenthashmap等多种实现方式。hashmap是从 jdk1.2 引入的,

hashmap:

  • 底层数组+链表实现,可以存储 null 键和 null 值,线程不安全
  • 初始 size 为16,扩容:newsize = oldsize*2,size 一定为 2 的 n 次幂
  • 扩容针对整个 Map,每次扩容时,原来数组中的元素依次重新计算存放位置,并重新插入
  • 插入元素后才判断该不该扩容,有可能无效扩容(插入后如果扩容,如果没有再次插入,就会产生无效扩容)
  • 当 Map 中元素总数超过 Entry 数组的 75%,触发扩容操作,为了减少链表长度,元素分配更均匀
  • 计算 index 方法:index = hash & (tab.length – 1)

hashtable:

  • 底层数组+链表实现,无论 key 还是 value 都不能为 null,线程安全,实现线程安全的方式是在修改数据时锁住整个 HashTable,效率低,ConcurrentHashMap 做了相关优化
  • 初始 size 为11,扩容:newsize = olesize*2+1
  • 计算 index 的方法:index = (hash & 0x7FFFFFFF) % tab.length

ConcurrentHashMap

  • 底层采用分段的数组+链表实现,线程安全
  • 通过把整个 Map 分为 N 个 Segment,可以提供相同的线程安全,但是效率提升 N 倍,默认提升 16 倍。(读操作不加锁,由于 HashEntry 的 value 变量是 volatile 的,也能保证读取到最新的值。)
  • Hashtable 的 synchronized 是针对整张 Hash 表的,即每次锁住整张表让线程独占,ConcurrentHashMap 允许多个修改操作并发进行,其关键在于使用了锁分离技术
  • 有些方法需要跨段,比如 size()和 containsValue(),它们可能需要锁定整个表而而不仅仅是某个段,这需要按顺序锁定所有段,操作完毕后,又按顺序释放所有段的锁
  • 扩容:段内扩容(段内元素超过该段对应 Entry 数组长度的 75%触发扩容,不会对整个 Map 进行扩容),插入前检测需不需要扩容,有效避免无效扩容

ConcurrentHashMap 是使用了锁分段技术来保证线程安全的。

锁分段技术:首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。

ConcurrentHashMap 提供了与 Hashtable 和 SynchronizedMap 不同的锁机制。Hashtable 中采用的锁机制是一次锁住整个 hash 表,从而在同一时刻只能由一个线程对其进行操作;而 ConcurrentHashMap 中则是一次锁住一个桶。

ConcurrentHashMap 默认将 hash 表分为 16 个桶,诸如 get、put、remove 等常用操作只锁住当前需要用到的桶。这样,原来只能一个线程进入,现在却能同时有 16 个写线程执行,并发性能的提升是显而易见的。

参考

  1. 探索 ConcurrentHashMap 高并发性的实现机制
updatedupdated2024-05-102024-05-10