Mysql 索引(笔记)

本贴最后更新于 2663 天前,其中的信息可能已经时移世改

一、mysql 支持的索引类型

1.B-tree 索引

特点

  • B-tree 是以 B+ 树的结构存储数据
  • B-tree 可以加快数据的查询速度
  • B-tree 更适合进行范围查找

适用情况

  • 全值匹配的查询(如:order_sn='123123',可使用此列的索引)
  • 匹配最左前缀的查询(如:实际没有 order_sn 这列的索引,但是联合索引 order_sn,order_date 中最左边包含,则可直接利用此索引查找)
  • 匹配列前缀的查询(如:order_sn like '123%'
  • 匹配值的范围查询(如:order_sn > '111111' AND order_sn < '222222'
  • 精确匹配左前列并范围匹配另外一列(如:对于联合索引 order_sn,order_date,精确查找 order_sn 列,并范围查找 order_date 时)
  • 只访问索引的查询(覆盖索引)
  • 适合使用在 order by、group by 中

使用限制

  • 不是按照索引最左列开始查找,则无法使用索引(如:对于联合索引 order_sn,order_date,只查找 order_date 时,无法使用此索引)
  • 使用索引时不能跳过索引中的列(如:对于联合索引 order_sn,order_date,user_id,查找条件中只有 order_sn 和 user_id 的话,只能使用到 order_sn 的索引,无法使用 user_id)
  • NOT IN 和 <> 操作无法使用到索引
  • 如果查询中有某个列是范围查询,则其右边所有列无法使用索引(如:对于联合索引 order_sn,order_date,user_id,条件中有 order_sn 精确查找,order_date 的范围查找,user_id 无法使用到索引)

2.Hash 索引

Innodb 会建立自适应的 Hash 索引

特点

  • Hash 索引时基于 Hash 表实现的,只有查询条件精确匹配 Hash 索引中的所有列时,才能使用到 Hash 索引(只有等值查询)
  • 对于 Hash 引擎中的所有列,存储引擎会为每一行计算一个 Hash 码,Hash 索引中存储的就是 Hash 码

限制

  • 使用 Hash 索引会进行两次查找,但不影响效率
  • Hash 索引无法用于排序
  • Hash 索引不支持部分索引查找也不支持范围查找
  • Hash 索引中的 Hash 码的计算可能存在 Hash 冲突(不利于列有很多重复值的查找,如性别)

3.索引作用

  • 索引减少了存储引擎需要扫描的数据量
  • 索引可以帮助排序,以避免使用临时表
  • 索引可以把随机 I/O 变为顺序 I/O

4.索引增加的损耗

  • 索引会增加写操作的成本(Innodb 会利用插入缓存减少频繁写操作)
  • 太多索引会增加查询优化器的选择时间

二、索引优化

  • 索引列上使用表达式或者函数,无法使用索引

1.优化策略

(1)前缀索引和索引列的选择性:

  • Innodb 的索引的最大宽度 767 字节,换算到 utf8 中是 255 个字符
  • MyISAM 的索引的最大宽度是 1000 字节
  • 所以创建列的前缀索引更节约空间,有效利用索引
  • 创建方式 CREATE INDEX index_name ON table_name(col_name(n)) 其中 n 就是对 col_name 列索引的宽度
  • 前缀索引以不降低索引的选择性为准
  • 索引的选择性:不重复的索引值和表的记录数的比值,索引唯一性越高选择性越高

(2)联合索引

选择索引列的顺序

  • 经常会被使用到的列优先
  • 选择性高的列优先
  • 选择性差的索引不宜放在前面,索引优化器不一定会使用(如:status(1,2,3)这种列)
  • 宽度小的列优先使用

(3)覆盖索引

即查询的列中包含了被索引的列的

Extra 中 Using index 指 select 中的 last_name 使用了覆盖索引(last_name 有索引 idx_actor_last_name)

优点

  • 可以优化缓存,减少磁盘 IO 操作
  • 可以减少随机 IO,变随机 IO 为顺序 IO
  • 可以避免对 Innodb 主键索引的二次查询
  • 可以避免 MyISAM 表进行系统调用

无法使用覆盖索引

  • 存储引擎不支持覆盖索引(memery 不能使用,Hash 索引不能作为覆盖索引使用)
  • 查询中使用了太多的列(比如 select * 就无法使用)
  • 使用了双 % 号的 like 查询

(4)使用索引优化查询

使用索引扫描优化排序

  • 索引列的顺序和 order by 子句的顺序完全一致
  • 索引中所有列的方向(升序、降序)和 order by 子句完全一致(联合索引中的两列,在 order by 中方向不一致时,无法使用索引)
  • order by 中的字段全部在关联表的第一张表中

B-tree 索引模拟 Hash 索引优化查询(Innodb 不能直接使用 Hash 索引)

  • 方式:简历一个字段的 md5 后值的字段,并对其建立索引,之后使用触发器等对其进行维护,查询时 where xxx_md5 = md5('nnnn') and xxx = 'nnn',后面条件用于避免 Hash 冲突
  • 只能处理键值的全值匹配查找
  • 所使用的 Hash 函数决定着索引建的大小(如上 md5 的字段是 32 位)

(5)利用索引优化锁

  • 索引可以减少锁的行数
  • 索引可以加快处理速度,同时也加快了所的释放

(6)索引的维护和优化

  • 删除重复和冗余的索引(主键索引过的字段不需要再加入联合索引中,因联合索引会自动引用主键索引)
  • 使用工具查找:pt-duplicate-key-checker h=127.0.0.1
  • 查找未被使用过的索引,删除不需要的
  • 查找 SQL:SELECT object_schema,object_name,index_name,b.\ TABLE_ROWS` FROM performance_schema.table_io_waits_summary_by_index_usage a JOIN information_schema.tables b ON a.`OBJECT_SCHEMA`=b.`TABLE_SCHEMA` AND a.`OBJECT_NAME`=b.`TABLE_NAME` WHERE index_name IS NOT NULL AND count_star = 0 ORDER BY object_schema,object_name;`
  • 更新索引系统信息及减少索引碎片,更新索引:analyze table table_name,整理碎片:optimize table table_name
  • 索引
    23 引用 • 28 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    675 引用 • 535 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 10 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 21 关注
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    131 引用 • 1114 回帖 • 136 关注
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 2 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    45 引用 • 25 回帖 • 2 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖 • 1 关注
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    287 引用 • 4484 回帖 • 660 关注
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 53 关注
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 115 关注
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    497 引用 • 1386 回帖 • 324 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 3 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    109 引用 • 54 回帖
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    19 引用 • 31 回帖
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖 • 1 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    54 引用 • 85 回帖
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 10 关注
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    122 引用 • 73 回帖
  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 83 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    546 引用 • 3531 回帖 • 1 关注
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 519 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    124 引用 • 580 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 565 关注