Mysql 索引(笔记)

本贴最后更新于 2752 天前,其中的信息可能已经时移世改

一、mysql 支持的索引类型

1.B-tree 索引

特点

  • B-tree 是以 B+ 树的结构存储数据
  • B-tree 可以加快数据的查询速度
  • B-tree 更适合进行范围查找

适用情况

  • 全值匹配的查询(如:order_sn='123123',可使用此列的索引)
  • 匹配最左前缀的查询(如:实际没有 order_sn 这列的索引,但是联合索引 order_sn,order_date 中最左边包含,则可直接利用此索引查找)
  • 匹配列前缀的查询(如:order_sn like '123%'
  • 匹配值的范围查询(如:order_sn > '111111' AND order_sn < '222222'
  • 精确匹配左前列并范围匹配另外一列(如:对于联合索引 order_sn,order_date,精确查找 order_sn 列,并范围查找 order_date 时)
  • 只访问索引的查询(覆盖索引)
  • 适合使用在 order by、group by 中

使用限制

  • 不是按照索引最左列开始查找,则无法使用索引(如:对于联合索引 order_sn,order_date,只查找 order_date 时,无法使用此索引)
  • 使用索引时不能跳过索引中的列(如:对于联合索引 order_sn,order_date,user_id,查找条件中只有 order_sn 和 user_id 的话,只能使用到 order_sn 的索引,无法使用 user_id)
  • NOT IN 和 <> 操作无法使用到索引
  • 如果查询中有某个列是范围查询,则其右边所有列无法使用索引(如:对于联合索引 order_sn,order_date,user_id,条件中有 order_sn 精确查找,order_date 的范围查找,user_id 无法使用到索引)

2.Hash 索引

Innodb 会建立自适应的 Hash 索引

特点

  • Hash 索引时基于 Hash 表实现的,只有查询条件精确匹配 Hash 索引中的所有列时,才能使用到 Hash 索引(只有等值查询)
  • 对于 Hash 引擎中的所有列,存储引擎会为每一行计算一个 Hash 码,Hash 索引中存储的就是 Hash 码

限制

  • 使用 Hash 索引会进行两次查找,但不影响效率
  • Hash 索引无法用于排序
  • Hash 索引不支持部分索引查找也不支持范围查找
  • Hash 索引中的 Hash 码的计算可能存在 Hash 冲突(不利于列有很多重复值的查找,如性别)

3.索引作用

  • 索引减少了存储引擎需要扫描的数据量
  • 索引可以帮助排序,以避免使用临时表
  • 索引可以把随机 I/O 变为顺序 I/O

4.索引增加的损耗

  • 索引会增加写操作的成本(Innodb 会利用插入缓存减少频繁写操作)
  • 太多索引会增加查询优化器的选择时间

二、索引优化

  • 索引列上使用表达式或者函数,无法使用索引

1.优化策略

(1)前缀索引和索引列的选择性:

  • Innodb 的索引的最大宽度 767 字节,换算到 utf8 中是 255 个字符
  • MyISAM 的索引的最大宽度是 1000 字节
  • 所以创建列的前缀索引更节约空间,有效利用索引
  • 创建方式 CREATE INDEX index_name ON table_name(col_name(n)) 其中 n 就是对 col_name 列索引的宽度
  • 前缀索引以不降低索引的选择性为准
  • 索引的选择性:不重复的索引值和表的记录数的比值,索引唯一性越高选择性越高

(2)联合索引

选择索引列的顺序

  • 经常会被使用到的列优先
  • 选择性高的列优先
  • 选择性差的索引不宜放在前面,索引优化器不一定会使用(如:status(1,2,3)这种列)
  • 宽度小的列优先使用

(3)覆盖索引

即查询的列中包含了被索引的列的

Extra 中 Using index 指 select 中的 last_name 使用了覆盖索引(last_name 有索引 idx_actor_last_name)

优点

  • 可以优化缓存,减少磁盘 IO 操作
  • 可以减少随机 IO,变随机 IO 为顺序 IO
  • 可以避免对 Innodb 主键索引的二次查询
  • 可以避免 MyISAM 表进行系统调用

无法使用覆盖索引

  • 存储引擎不支持覆盖索引(memery 不能使用,Hash 索引不能作为覆盖索引使用)
  • 查询中使用了太多的列(比如 select * 就无法使用)
  • 使用了双 % 号的 like 查询

(4)使用索引优化查询

使用索引扫描优化排序

  • 索引列的顺序和 order by 子句的顺序完全一致
  • 索引中所有列的方向(升序、降序)和 order by 子句完全一致(联合索引中的两列,在 order by 中方向不一致时,无法使用索引)
  • order by 中的字段全部在关联表的第一张表中

B-tree 索引模拟 Hash 索引优化查询(Innodb 不能直接使用 Hash 索引)

  • 方式:简历一个字段的 md5 后值的字段,并对其建立索引,之后使用触发器等对其进行维护,查询时 where xxx_md5 = md5('nnnn') and xxx = 'nnn',后面条件用于避免 Hash 冲突
  • 只能处理键值的全值匹配查找
  • 所使用的 Hash 函数决定着索引建的大小(如上 md5 的字段是 32 位)

(5)利用索引优化锁

  • 索引可以减少锁的行数
  • 索引可以加快处理速度,同时也加快了所的释放

(6)索引的维护和优化

  • 删除重复和冗余的索引(主键索引过的字段不需要再加入联合索引中,因联合索引会自动引用主键索引)
  • 使用工具查找:pt-duplicate-key-checker h=127.0.0.1
  • 查找未被使用过的索引,删除不需要的
  • 查找 SQL:SELECT object_schema,object_name,index_name,b.\ TABLE_ROWS` FROM performance_schema.table_io_waits_summary_by_index_usage a JOIN information_schema.tables b ON a.`OBJECT_SCHEMA`=b.`TABLE_SCHEMA` AND a.`OBJECT_NAME`=b.`TABLE_NAME` WHERE index_name IS NOT NULL AND count_star = 0 ORDER BY object_schema,object_name;`
  • 更新索引系统信息及减少索引碎片,更新索引:analyze table table_name,整理碎片:optimize table table_name
  • 索引
    24 引用 • 28 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    690 引用 • 535 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1434 引用 • 10054 回帖 • 490 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 339 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    75 引用 • 1737 回帖 • 5 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 136 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖 • 1 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    190 引用 • 1057 回帖
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    85 引用 • 139 回帖 • 1 关注
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖
  • 安装

    你若安好,便是晴天。

    132 引用 • 1184 回帖
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用 • 1 关注
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    75 引用 • 258 回帖 • 617 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 344 回帖
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • 创业

    你比 99% 的人都优秀么?

    84 引用 • 1399 回帖
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 680 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 787 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    21 引用 • 245 回帖 • 241 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 724 关注
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    287 引用 • 4484 回帖 • 669 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 22 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 595 关注