Mysql 索引(笔记)

本贴最后更新于 2904 天前,其中的信息可能已经时移世改

一、mysql 支持的索引类型

1.B-tree 索引

特点

  • B-tree 是以 B+ 树的结构存储数据
  • B-tree 可以加快数据的查询速度
  • B-tree 更适合进行范围查找

适用情况

  • 全值匹配的查询(如:order_sn='123123',可使用此列的索引)
  • 匹配最左前缀的查询(如:实际没有 order_sn 这列的索引,但是联合索引 order_sn,order_date 中最左边包含,则可直接利用此索引查找)
  • 匹配列前缀的查询(如:order_sn like '123%'
  • 匹配值的范围查询(如:order_sn > '111111' AND order_sn < '222222'
  • 精确匹配左前列并范围匹配另外一列(如:对于联合索引 order_sn,order_date,精确查找 order_sn 列,并范围查找 order_date 时)
  • 只访问索引的查询(覆盖索引)
  • 适合使用在 order by、group by 中

使用限制

  • 不是按照索引最左列开始查找,则无法使用索引(如:对于联合索引 order_sn,order_date,只查找 order_date 时,无法使用此索引)
  • 使用索引时不能跳过索引中的列(如:对于联合索引 order_sn,order_date,user_id,查找条件中只有 order_sn 和 user_id 的话,只能使用到 order_sn 的索引,无法使用 user_id)
  • NOT IN 和 <> 操作无法使用到索引
  • 如果查询中有某个列是范围查询,则其右边所有列无法使用索引(如:对于联合索引 order_sn,order_date,user_id,条件中有 order_sn 精确查找,order_date 的范围查找,user_id 无法使用到索引)

2.Hash 索引

Innodb 会建立自适应的 Hash 索引

特点

  • Hash 索引时基于 Hash 表实现的,只有查询条件精确匹配 Hash 索引中的所有列时,才能使用到 Hash 索引(只有等值查询)
  • 对于 Hash 引擎中的所有列,存储引擎会为每一行计算一个 Hash 码,Hash 索引中存储的就是 Hash 码

限制

  • 使用 Hash 索引会进行两次查找,但不影响效率
  • Hash 索引无法用于排序
  • Hash 索引不支持部分索引查找也不支持范围查找
  • Hash 索引中的 Hash 码的计算可能存在 Hash 冲突(不利于列有很多重复值的查找,如性别)

3.索引作用

  • 索引减少了存储引擎需要扫描的数据量
  • 索引可以帮助排序,以避免使用临时表
  • 索引可以把随机 I/O 变为顺序 I/O

4.索引增加的损耗

  • 索引会增加写操作的成本(Innodb 会利用插入缓存减少频繁写操作)
  • 太多索引会增加查询优化器的选择时间

二、索引优化

  • 索引列上使用表达式或者函数,无法使用索引

1.优化策略

(1)前缀索引和索引列的选择性:

  • Innodb 的索引的最大宽度 767 字节,换算到 utf8 中是 255 个字符
  • MyISAM 的索引的最大宽度是 1000 字节
  • 所以创建列的前缀索引更节约空间,有效利用索引
  • 创建方式 CREATE INDEX index_name ON table_name(col_name(n)) 其中 n 就是对 col_name 列索引的宽度
  • 前缀索引以不降低索引的选择性为准
  • 索引的选择性:不重复的索引值和表的记录数的比值,索引唯一性越高选择性越高

(2)联合索引

选择索引列的顺序

  • 经常会被使用到的列优先
  • 选择性高的列优先
  • 选择性差的索引不宜放在前面,索引优化器不一定会使用(如:status(1,2,3)这种列)
  • 宽度小的列优先使用

(3)覆盖索引

即查询的列中包含了被索引的列的

Extra 中 Using index 指 select 中的 last_name 使用了覆盖索引(last_name 有索引 idx_actor_last_name)

优点

  • 可以优化缓存,减少磁盘 IO 操作
  • 可以减少随机 IO,变随机 IO 为顺序 IO
  • 可以避免对 Innodb 主键索引的二次查询
  • 可以避免 MyISAM 表进行系统调用

无法使用覆盖索引

  • 存储引擎不支持覆盖索引(memery 不能使用,Hash 索引不能作为覆盖索引使用)
  • 查询中使用了太多的列(比如 select * 就无法使用)
  • 使用了双 % 号的 like 查询

(4)使用索引优化查询

使用索引扫描优化排序

  • 索引列的顺序和 order by 子句的顺序完全一致
  • 索引中所有列的方向(升序、降序)和 order by 子句完全一致(联合索引中的两列,在 order by 中方向不一致时,无法使用索引)
  • order by 中的字段全部在关联表的第一张表中

B-tree 索引模拟 Hash 索引优化查询(Innodb 不能直接使用 Hash 索引)

  • 方式:简历一个字段的 md5 后值的字段,并对其建立索引,之后使用触发器等对其进行维护,查询时 where xxx_md5 = md5('nnnn') and xxx = 'nnn',后面条件用于避免 Hash 冲突
  • 只能处理键值的全值匹配查找
  • 所使用的 Hash 函数决定着索引建的大小(如上 md5 的字段是 32 位)

(5)利用索引优化锁

  • 索引可以减少锁的行数
  • 索引可以加快处理速度,同时也加快了所的释放

(6)索引的维护和优化

  • 删除重复和冗余的索引(主键索引过的字段不需要再加入联合索引中,因联合索引会自动引用主键索引)
  • 使用工具查找:pt-duplicate-key-checker h=127.0.0.1
  • 查找未被使用过的索引,删除不需要的
  • 查找 SQL:SELECT object_schema,object_name,index_name,b.\ TABLE_ROWS` FROM performance_schema.table_io_waits_summary_by_index_usage a JOIN information_schema.tables b ON a.`OBJECT_SCHEMA`=b.`TABLE_SCHEMA` AND a.`OBJECT_NAME`=b.`TABLE_NAME` WHERE index_name IS NOT NULL AND count_star = 0 ORDER BY object_schema,object_name;`
  • 更新索引系统信息及减少索引碎片,更新索引:analyze table table_name,整理碎片:optimize table table_name
  • 索引
    24 引用 • 28 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    693 引用 • 537 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖 • 1 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 3 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 568 关注
  • abitmean

    有点意思就行了

    37 关注
  • 自由行
    5 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    79 引用 • 431 回帖
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 17 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25203 引用 • 103945 回帖 • 1 关注
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 381 关注
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    133 引用 • 1124 回帖 • 115 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    173 引用 • 414 回帖 • 367 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖
  • Office

    Office 现已更名为 Microsoft 365. Microsoft 365 将高级 Office 应用(如 Word、Excel 和 PowerPoint)与 1 TB 的 OneDrive 云存储空间、高级安全性等结合在一起,可帮助你在任何设备上完成操作。

    5 引用 • 34 回帖
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 177 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 195 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    89 引用 • 122 回帖 • 616 关注
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 6 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    180 引用 • 408 回帖 • 490 关注
  • Word
    13 引用 • 40 回帖
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 387 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    108 引用 • 295 回帖 • 2 关注
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 183 关注
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 3 关注
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 110 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 679 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 343 关注
  • 创业

    你比 99% 的人都优秀么?

    82 引用 • 1395 回帖 • 1 关注