HashMap

本贴最后更新于 2663 天前,其中的信息可能已经事过景迁

java.util.HashMap

一、特点
1、key 和 value 都允许为空,key 只允许有一个为 null。
2、无序(这个无序指的是遍历集合的时候取出元素的顺序基本不可能是 put 的顺序)。
3、线程不安全。

二、容量 Capacity 和负载因子 Load Factor
1 capacity 默认初始化容量为 16。
2 当 hashmap 中桶被装满的数量大于容量乘以负载因子的时候会进行 rehash。

三、put 方法
1 对 key 的哈希值做 hash,然后进行取余操作;
2 根据取余结果查找对应的桶,如果没碰撞直接插入;
3 如果碰撞,插入链表头部,当链表长度过长(默认是 8),就把链表转换成红黑树;
4 如果已经存在 key 相同的节点,就替换;
5 如果桶被装满的数量大于容量乘以负载因子,那么就会进行 rehash。

四、get 方法
1 根据 key 的哈希值做 hash,然后取余;
2 根据取余结果定位到具体的桶,然后通过 equals 方法逐个节点比较 key 是否相同直到找到节点或节点不存在。

五、hash(Object key)方法
1 key 为 null,直接返回 0;
2 根据 Object.hashCode()方法获取 key 的 hashcode;
3 然后这个 hashcode 的高 16 位不变,低 16 位和高 16 位做一个异或操作;(保证 32 位的 hashcode 都参与了后面的取余操作,降低碰撞几率)

取余操作,不是通过取余符号 %,而是通过按位与(&)运算。(位运算速度快)

六、rehash 死循环问题(JDK1.8 之前)
假设
oldTable[i]->node1->node2
rehash 为:
newTable[j]->node2->node1


e
next = e.next

e.next = newTable(i);
newTable[i] = e;

e = next

线程一执行了

e //node1
next = e.next //node2

然后失去 CPU。
线程二获得 CPU 并执行完 rehash,此时

newTable[j]->node2->node1

线程一又获得 CPU 了,因为变量 e 和 next 都是局部变量,属于线程私有,所以此时

e //node1
next = e.next //node2

执行了一个节点的插入后产生死循环

node1.next = node2;
node2.next = node1;

这样 next 变量永远不可能为 null,循环就不会停止。

七、JDK1.8 resize 方法优化
每次扩容为之前的两倍,按位与的位数加 1,加的这一位只能为 0 或 1,0 的话结果不变,1 的话原位置 + 原容量。(省去重新计算 hash 的时间)。
JDK1.8 的链表元素不会倒置,因为设置了一个尾指针。

八、HashMap 的其他线程不安全问题
1 两个线程同时往同一个桶插入节点时,并发情况下会产生覆盖。

参考:
HashMap 源码
Java HashMap 工作原理及实现
Java 8 系列之重新认识 HashMap

相关帖子

回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖 • 3 关注
  • Excel
    31 引用 • 28 回帖 • 1 关注
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 45 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    87 引用 • 122 回帖 • 628 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 804 关注
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 4 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 4 关注
  • 导航

    各种网址链接、内容导航。

    42 引用 • 177 回帖 • 2 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    267 引用 • 666 回帖 • 2 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 387 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 544 关注
  • 反馈

    Communication channel for makers and users.

    124 引用 • 928 回帖 • 268 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    27 引用 • 196 回帖 • 25 关注
  • OnlyOffice
    4 引用 • 21 关注
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    315 引用 • 547 回帖
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    198 引用 • 541 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    9234 引用 • 41978 回帖 • 123 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    143 引用 • 442 回帖
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 685 关注
  • Access
    1 引用 • 3 回帖 • 6 关注
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 94 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    125 引用 • 828 回帖
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 1 关注