zzTzz

公告

欢迎来到博客！这是示例公告

Learn More

标签

zzTzz

公告

欢迎来到博客！这是示例公告

Learn More

标签

Java Spring Boot Vue.js 数据库测试脚本命令运维闲聊

9138 字

18 分钟

Java 面试深度解析：HashMap 底层原理与源码剖析（2026版）

2026-04-03

学习笔记

Java

Java 面试深度解析：HashMap 底层原理与源码剖析

在面试中，HashMap 是 Java 集合框架中最常被问到的知识点之一。本文将深入剖析 HashMap 的底层实现原理，帮助你在面试中从容应对相关问题。

一、面试常见问题引入

面试官通常会这样提问：

HashMap 的底层数据结构是什么？

HashMap 的 put 方法执行流程是怎样的？

为什么 HashMap 的容量是 2 的幂次方？

HashMap 的扩容机制是怎样的？

HashMap 是线程安全的吗？如何实现线程安全？

带着这些问题，我们来深入分析 HashMap 的实现原理。

二、HashMap 的数据结构

2.1 核心结构

HashMap 的核心结构在 JDK 1.8 中进行了优化，主要包含：

// HashMap 的核心成员变量
transient Node<K,V>[] table;  // 存储数据的数组，也称为哈希桶数组
transient int size;           // 实际存储的键值对数量
transient int modCount;       // 结构修改次数，用于快速失败
int threshold;                // 扩容阈值 = capacity * loadFactor
final float loadFactor;       // 负载因子，默认 0.75

2.2 Node 节点结构

// 基本的哈希节点
static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;    // 哈希值
    final K key;       // 键
    V value;           // 值
    Node<K,V> next;    // 指向下一个节点（链表结构）
    
    // 构造函数和 getter/setter 省略...
}

2.3 红黑树节点（JDK 1.8+）

当链表长度超过 8 且数组长度超过 64 时，链表会转换为红黑树：

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;
    TreeNode<K,V> left;
    TreeNode<K,V> right;
    TreeNode<K,V> prev;
    boolean red;
    
    // 树操作相关方法...
}

三、核心方法源码解析

3.1 哈希值计算

static final int hash(Object key) {
    int h;
    // 高 16 位与低 16 位异或，减少哈希冲突
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

3.2 put 方法执行流程

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    
    // 1. 如果 table 为空，先初始化
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    
    // 2. 计算索引位置，如果为空直接插入
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        
        // 3. 第一个节点的 key 相同，覆盖
        if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        // 4. 如果是树节点，按树的方式插入
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            // 5. 遍历链表
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 链表长度超过 8，转红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1)
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        
        // 6. key 已存在，更新 value
        if (e != null) {
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    
    ++modCount;
    // 7. 超过阈值，扩容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

3.3 扩容机制（resize）

扩容是 HashMap 的关键操作，JDK 1.8 中做了优化：

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    
    if (oldCap > 0) {
        // 超过最大容量，不再扩容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 容量翻倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // 阈值翻倍
    }
    else if (oldThr > 0)
        newCap = oldThr;
    else {
        // 初始化
        newCap = DEFAULT_INITIAL_CAPACITY; // 16
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); // 12
    }
    
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    
    @SuppressWarnings({"rawtypes","unchecked"})
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    
    // 迁移旧数据到新数组
    if (oldTab != null) {
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else {
                    // 优化：拆分为两条链表
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

四、关键设计要点解析

4.1 为什么容量是 2 的幂次方？

// 计算索引位置
(n - 1) & hash  // 等价于 hash % n，但位运算更快

// 举例：n = 16 时
(n - 1) = 15 = 0b1111
hash & 0b1111  // 只保留低 4 位，范围 0-15

优点：

位运算 & 比取模 % 更高效
保证哈希值均匀分布

4.2 高 16 位异或的作用

// hashCode 的高 16 位与低 16 位异或
(h = key.hashCode()) ^ (h >>> 16)

原因：当数组长度较小时（如 16），(n-1) & hash 实际上只使用了 hash 的低 4 位。通过异或高 16 位，可以让高位也参与运算，减少哈希冲突。

4.3 负载因子为什么是 0.75？

// 默认负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;

原因：

如果设置过高（如 0.9）：空间利用率高，但哈希冲突增加，查询效率降低
如果设置过低（如 0.5）：冲突减少，但空间浪费严重
0.75 是在时间和空间成本上的折中，符合泊松分布的统计规律

五、线程安全问题

5.1 HashMap 不是线程安全的

JDK 1.7 中的"死循环"问题：

// 并发扩容时可能出现环形链表
do {
    next = e.next;
    // 线程 A 执行到这里被挂起
    // 线程 B 完成扩容，链表顺序反转
    // 线程 A 继续执行，形成环形链表
    newTab[i] = e;
    e = next;
} while (e != null);

JDK 1.8 虽然解决了死循环问题，但仍存在数据丢失的风险。

5.2 线程安全的替代方案

方案	特点	适用场景
ConcurrentHashMap	分段锁/CAS，高并发	首选方案
Collections.synchronizedMap	全局锁，性能低	简单场景
HashTable	全局锁，已过时	不推荐

5.3 ConcurrentHashMap 简介

JDK 1.8 中的 ConcurrentHashMap 采用 CAS + synchronized：

// 核心 put 逻辑（简化）
final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // CAS 尝试插入
            if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
                break;
        }
        // ... 其他情况
    }
    addCount(1L, binCount);
    return null;
}

六、面试回答技巧

6.1 回答框架

问题：请讲一下 HashMap 的实现原理？

推荐回答结构：

总体介绍：HashMap 是基于哈希表实现的 Map 接口，底层使用数组+链表+红黑树（JDK 1.8+）
核心机制：
- 通过 key 的 hashCode 计算哈希值
- 使用 (n-1) & hash 定位数组索引
- 冲突时使用链表法解决
JDK 1.8 优化：
- 链表长度超过 8 且数组长度超过 64 时转换为红黑树
- 扩容时优化了 rehash 过程
线程安全问题：
- HashMap 不是线程安全的
- 推荐使用 ConcurrentHashMap

6.2 常见陷阱

陷阱 1：认为 HashMap 是有序的

// 错误认知：HashMap 是按插入顺序排列的
// 正确：HashMap 不保证顺序，如需顺序使用 LinkedHashMap

陷阱 2：忽视 resize 的性能影响

// 如果预知数据量，应该指定初始容量
// 避免频繁的扩容操作
Map<String, String> map = new HashMap<>(10000);

陷阱 3：使用可变对象作为 key

// 错误：使用 StringBuilder 作为 key，其内容可变
StringBuilder sb = new StringBuilder("key");
map.put(sb, "value");
sb.append("changed"); // key 的 hashCode 变了！
// 再也找不到这个 key 了

七、总结

本文深入剖析了 HashMap 的实现原理，包括：

知识点	核心内容
数据结构	数组 + 链表 + 红黑树（JDK 1.8+）
哈希计算	hashCode 高 16 位与低 16 位异或
索引定位	`(n-1) & hash` 替代 `%` 取模
扩容机制	容量翻倍，元素重新散列
树化条件	链表长度 ≥ 8 且数组长度 ≥ 64
线程安全	非线程安全，推荐 ConcurrentHashMap

面试建议：

理解原理比背诵源码更重要：面试官更关注你是否理解设计思想
注意版本差异：JDK 1.7 和 1.8 的实现有很大不同
结合实践：如果有过性能调优经验，可以结合实际案例说明
举一反三：理解 HashMap 后，ConcurrentHashMap、LinkedHashMap 等就更容易理解了

掌握 HashMap 不仅是应对面试的需要，更是理解 Java 集合框架设计思想的重要窗口。