大厂是如何考察 HashMap 的

一、HashMap 的底层数据结构

HashMap 是我们非常常用的数据结构，由数组和链表组合构成的数据结构。
在不发生 hash 冲撞的情况下数据结构是数组，一但出现 hash 冲突，则 Entry.next 来实现链表结构

大概如下，数组里面每个地方都存了 Key-Value 这样的实例，在 Java7 叫 Entry 在 Java8 中叫 Node。

二、链表节点是怎么插入的

java7 头插法，就是说新来的值会取代原有的值，原有的值就顺推到链表中去，就像上面的例子一样，因为写这个代码的作者认为后来的值被查找的可能性更大一点，提升查找的效率。
但是，在 java8 之后，都是所用尾部插入了。（图画的有点 low，体谅）

tip:为啥尾部插呢？就是因为多线程情况，在扩容的时候容易形成闭环（死循环），最后面我会画图说明这个问题的，大家耐心往下看。毕竟这是本文的重点

三、什么时候扩容

数组容量是有限的，数据多次插入的，到达一定的数量就会进行扩容，也就是 resize。什么时候 resize 呢？有两个因素：Capacity：HashMap 当前长度。

LoadFactor：负载因子，默认值 0.75f。

怎么理解呢，就比如当前的容量大小为 16，当你存进第 14 个的时候，判断发现需要进行 resize 了，那就进行扩容，但是 HashMap 的扩容也不是简单的扩大点容量这么简单的。
扩容分两步
1.创建一个新的 Entry 空数组，长度是原数组的 2 倍。
2.遍历原 Entry 数组，把所有的 Entry 重新 Hash 到新数组。
（为什么不直接复制过去呢？是因为 hash 在计算的时候其实涉及了数组长度，你扩容长度都改变了，那么就好导致扩容前后计算的 hash 值是不一样的）

四、为什么默认初始化长度为 16

因为计算位置的时候用到了位运算(位与运算比算数计算的效率高了很多)
index 的计算公式：index = HashCode（Key） & （Length- 1）其实这个计算 index 的方法和 hashCode%length 小说是一样的
例如： hashCode : 2 2%16 index= 2
hashCode: 2 （0010） & 1111(16-1 的二进制) = 0010（2）
所以用位与运算效果与取模一样，性能也提高了不少！

那为啥用 16 不用别的呢
因为在使用不是 2 的幂的数字的时候，Length-1 的值是所有二进制位全为 1，这种情况下，index 的结果等同于 HashCode 后几位的值。

只要输入的 HashCode 本身分布均匀，Hash 算法的结果就是均匀的。

这是为了实现均匀分布。

五、为什么要求是 2 的指数幂

因为底层 hash 运算是 h &(length -1) 这样情况能保证空间不浪费，如果传的是偶数，-1 后就是奇数，他的 2 进制位末尾肯定是 0 进行位运算末尾也是 0 一旦高位算出是 1 则好多空间浪费

HashMap 初始化时，如果指定容量大小为 10，那么实际大小是多少？

16，因为 HashMap 的初始化函数中规定容量大小要是 2 的指数倍，即 2，4，8，16，所以当指定容量为 10 时，实际容量为 16。

六、为啥不直接使用 hashCode

HashMap 的 hash(Obeject k)方法中为什么在调用 k.hashCode()方法获得 hash 值后，为什么不直接对这个 hash 进行取余，而是还要将 hash 值进行右移和异或运算？
A：如果 HashMap 容量比较小而 hash 值比较大的时候，哈希冲突就容易变多。基于 HashMap 的 indexFor 底层设计，假设容量为 16，那么就要对二进制 0000 1111（即 15）进行按位与操作，那么 hash 值的二进制的高 28 位无论是多少，都没意义，因为都会被 0&，变成 0。所以哈希冲突容易变多。那么 hash(Obeject k)方法中在调用 k.hashCode()方法获得 hash 值后，进行的一步运算：h^=(h>>>20)^(h>>>12);有什么用呢？首先，h>>>20 和 h>>>12 是将 h 的二进制中高位右移变成低位。其次异或运算是利用了特性：同 0 异 1 原则，尽可能的使得 h>>>20 和 h>>>12 在将来做取余（按位与操作方式）时都参与到运算中去。综上，简单来说，通过 h^=(h>>>20)^(h>>>12);运算，可以使 k.hashCode()方法获得的 hash 值的二进制中高位尽可能多地参与按位与操作，从而减少哈希冲突。

七、 HashMap 扩容的原因

提升 HashMap 的 get、put 等方法的效率，因为如果不扩容，链表就会越来越长，导致插入和查询效率都会变低。

八、 jdk 7 与 jdk 8 的比较

1.1.7 基于头插，1.8 是尾插

1.7 采用数组加链表，1.8 采用数组 + 红黑树（jdk1.8 引入红黑树后，如果单链表节点个数超过 8 个，是否一定会树化？
不一定，它会先去判断是否需要扩容（即判断当前节点个数是否大于扩容的阈值），如果满足扩容条件，直接扩容，不会树化，因为扩容不仅能增加容量，还能缩短单链表的节点数，一举两得。

，当链表节点个数超过 8 个（m 默认值）以后，开始使用红黑树，使用红黑树一个综合取优的选择，相对于其他数据结构，红黑树的查询和插入效率都比较高。而当红黑树的节点个数小于 6 个（默认值）以后，又开始使用链表。这两个阈值为什么不相同呢？主要是为了防止出现节点个数频繁在一个相同的数值来回切换，举个极端例子，现在单链表的节点个数是 9，开始变成红黑树，然后红黑树节点个数又变成 8，就又得变成单链表，然后节点个数又变成 9，就又得变成红黑树，这样的情况消耗严重浪费，因此干脆错开两个阈值的大小，使得变成红黑树后“不那么容易”就需要变回单链表，同样，使得变成单链表后，“不那么容易”就需要变回红黑树。
）

九、为什么 jdk.17 的 hashMap 扩容存在死循环

重点就是这：
Entry<K,V> next = e.next;（两个线程同时走到这，其中一个等待 CPU 的执行权，另一个直接顺利执行扩容，然后循环遍历旧集合，将数据迁移到新创建的集合中，因为链表这种节点的特殊性：当前节点持有下一个节点的引用，所以在迁移的过程中 next 的值会有问题下面看源代码大家简单了解下过程，后面画图讲解）

大厂是如何考察 HashMap 的

一、HashMap 的底层数据结构

二、链表节点是怎么插入的

三、什么时候扩容

四、为什么默认初始化长度为 16

五、为什么要求是 2 的指数幂

六、为啥不直接使用 hashCode

七、 HashMap 扩容的原因

八、 jdk 7 与 jdk 8 的比较

九、为什么 jdk.17 的 hashMap 扩容存在死循环

相关帖子

HashMap 学习总结

Java 容器类

Java 集合系列之 HashMap 源码分析

深入解读 HashMap 线程安全性问题

Java8 中 ConcurrentHashMap 是如何保证线程安全的

HashMap 深度解读

OpenJDK 编译问题

欢迎来到这里！

大厂是如何考察 HashMap 的

一、HashMap 的底层数据结构

二、链表节点是怎么插入的

三、什么时候扩容

四、为什么默认初始化长度为 16

五、为什么要求是 2 的指数幂

六、 为啥不直接使用 hashCode

七、 HashMap 扩容的原因

八、 jdk 7 与 jdk 8 的比较

九、为什么 jdk.17 的 hashMap 扩容存在死循环

相关帖子

HashMap 学习总结

Java 容器类

Java 集合系列之 HashMap 源码分析

深入解读 HashMap 线程安全性问题

Java8 中 ConcurrentHashMap 是如何保证线程安全的

HashMap 深度解读

OpenJDK 编译问题

欢迎来到这里！

六、为啥不直接使用 hashCode