从源代码看 HashMap 的加载因子和容量分配

一直知道 HashMap 有默认的容量和加载因子，今天想看看源代码，希望能了解的更清楚一些。

我们先看看默认的构造器吧，以下为我本机的 JDK6.0 的源代码.

/**
* 默认的初始化的容量，必须是2的幂次数<br>
* The default initial capacity - MUST be a power of two.
*/
static final int DEFAULT_INITIAL_CAPACITY = 16;
/**
* 默认的加载因子
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
* 下一个需要重新分配的尺寸值。等于容量乘以加载因子。<br>
* 也就是说，一旦容量到了这个数值，将重新分配容器的尺寸。
* The next size value at which to resize (capacity * load factor).
* @serial
*/
int threshold;
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
table = new Entry[DEFAULT_INITIAL_CAPACITY];
init();
}

从代码可以看出，默认的容量是16，而 threshold是16*0.75 = 12;
我们来看看增加的部分代码。

public V put(K key, V value) {
// 我们忽略掉这部分的代码，只看我们这里最关心的部分
addEntry(hash, key, value, i); // 这里增加了一个Entry,我们看看代码
return null;
}
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold) // 这里是关键，一旦大于等于threshold的数值
resize(2 * table.length); // 将会引起容量2倍的扩大
}
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity]; // 新的容器空间
transfer(newTable); // 复制数据过去
table = newTable;
threshold = (int)(newCapacity * loadFactor); // 重新计算threshold的值
}

好了，我想我们已经清楚大部分了。
其中有一点，起始容量必须是2的幂次，这如何保证呢？我们来看看其构造方法

public HashMap(int initialCapacity, float loadFactor) {
// 忽略掉一部分代码....
// Find a power of 2 >= initialCapacity
// 重新查找不比指定数值大的最大的2的幂次数
int capacity = 1;
while (capacity < initialCapacity)
capacity <<= 1;
// 其它的初始化代码 ...
}

好了，关于起始容量和加载因子的探讨我们就到这里了。我们应该有了一定的了解了。

总结：
相对准确的估算数据量，将极大的影响HashMap的性能，因为resize是一个重新分配的过程，耗时应该是里面最大的。
加载因子较小，会有更多的空间空闲，我不知道这个0.75是不是一个折中方案。也许0.9也是一个不错的选择，特别是那些数据量虽然很大，但不是经常变化的地方，比如公司人员，城市列表等相对比较固定的数据

HashMap 学习总结

[图片] 简介 HashMap 采用 key/value 存储结构，每个 key 对应唯一的 value，查询和修改的速度都很快，能达到 O(1)的平均时间复杂度。它是非线程安全的，且不保证元素存储的顺序。继承体系 public class HashMap extends AbstractMap implements ..

Java 容器类

[图片] 写在前面这篇短文不是一天就可以写出来的，特殊情况一直没有开学，就在家里面重新看了一遍《Java 核心技术》，我觉得 Java 集合类这一大块是真的很重要，就想着一边看一边写点东西来记一下。引言在 Java 的运行过程中，当运行环境符合某种条件的时候，程序就会不自觉的产生新的对象，但是在此之前，你并不 ..

深入解读 HashMap 线程安全性问题

[图片] 如果您觉得我的文章对您有帮助的话，记得在 GitHub 上 star 一波哈 GitHub_awesome-it-blog HashMap 是线程不安全的，在多线程环境下对某个对象中 HashMap 类型的实例变量进行操作时，可能会产生各种不符合预期的问题。本文详细说明一下 HashMap 存在的几个线程安 ..

Java8 中 ConcurrentHashMap 是如何保证线程安全的

[图片] 如果您觉得我的文章对您有帮助的话，记得在 GitHub 上 star 一波哈 GitHub_awesome-it-blog HashMap 是工作中使用频度非常高的一个 K-V 存储容器。在多线程环境下，使用 HashMap 是不安全的，可能产生各种非期望的结果。关于 HashMap 线程安全问题，可参考笔 ..

HashMap 深度解读

[图片] HashMap 解读在面试的过程中,面试官经常会向面试者提问关于 HashMap 的问题,今天我将在这篇文章中仔细介绍一下 HashMap. jdk7 中的 HashMap 介绍一下 HashMap 及其 put 和 set 方法实现 HashMap 是由数组加上链表的数据结构书写的,它使用 key-val ..

[求助] 导出格式和编辑格式大不一样

[图片] 差不多像这样，感觉有序无序编号都下移了很多。已经将代码块全部关闭。怀疑是用的 asri 主题有点问题（今天晚上刚进行一次更新），不过还不确定……导出功能很久没用了。有人知道是什么情况吗

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

相关帖子

HashMap 学习总结

Java 容器类

Java 集合系列之 HashMap 源码分析

深入解读 HashMap 线程安全性问题

Java8 中 ConcurrentHashMap 是如何保证线程安全的

HashMap 深度解读

[求助] 导出格式和编辑格式大不一样

欢迎来到这里！

近期热议

推荐标签标签

最新标签

从源代码看 HashMap 的加载因子和容量分配

相关帖子

HashMap 学习总结

Java 容器类

Java 集合系列之 HashMap 源码分析

深入解读 HashMap 线程安全性问题

Java8 中 ConcurrentHashMap 是如何保证线程安全的

HashMap 深度解读

[求助] 导出格式和编辑格式大不一样

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签