Mysql 索引(笔记)

本贴最后更新于 2783 天前,其中的信息可能已经时移世改

一、mysql 支持的索引类型

1.B-tree 索引

特点

  • B-tree 是以 B+ 树的结构存储数据
  • B-tree 可以加快数据的查询速度
  • B-tree 更适合进行范围查找

适用情况

  • 全值匹配的查询(如:order_sn='123123',可使用此列的索引)
  • 匹配最左前缀的查询(如:实际没有 order_sn 这列的索引,但是联合索引 order_sn,order_date 中最左边包含,则可直接利用此索引查找)
  • 匹配列前缀的查询(如:order_sn like '123%'
  • 匹配值的范围查询(如:order_sn > '111111' AND order_sn < '222222'
  • 精确匹配左前列并范围匹配另外一列(如:对于联合索引 order_sn,order_date,精确查找 order_sn 列,并范围查找 order_date 时)
  • 只访问索引的查询(覆盖索引)
  • 适合使用在 order by、group by 中

使用限制

  • 不是按照索引最左列开始查找,则无法使用索引(如:对于联合索引 order_sn,order_date,只查找 order_date 时,无法使用此索引)
  • 使用索引时不能跳过索引中的列(如:对于联合索引 order_sn,order_date,user_id,查找条件中只有 order_sn 和 user_id 的话,只能使用到 order_sn 的索引,无法使用 user_id)
  • NOT IN 和 <> 操作无法使用到索引
  • 如果查询中有某个列是范围查询,则其右边所有列无法使用索引(如:对于联合索引 order_sn,order_date,user_id,条件中有 order_sn 精确查找,order_date 的范围查找,user_id 无法使用到索引)

2.Hash 索引

Innodb 会建立自适应的 Hash 索引

特点

  • Hash 索引时基于 Hash 表实现的,只有查询条件精确匹配 Hash 索引中的所有列时,才能使用到 Hash 索引(只有等值查询)
  • 对于 Hash 引擎中的所有列,存储引擎会为每一行计算一个 Hash 码,Hash 索引中存储的就是 Hash 码

限制

  • 使用 Hash 索引会进行两次查找,但不影响效率
  • Hash 索引无法用于排序
  • Hash 索引不支持部分索引查找也不支持范围查找
  • Hash 索引中的 Hash 码的计算可能存在 Hash 冲突(不利于列有很多重复值的查找,如性别)

3.索引作用

  • 索引减少了存储引擎需要扫描的数据量
  • 索引可以帮助排序,以避免使用临时表
  • 索引可以把随机 I/O 变为顺序 I/O

4.索引增加的损耗

  • 索引会增加写操作的成本(Innodb 会利用插入缓存减少频繁写操作)
  • 太多索引会增加查询优化器的选择时间

二、索引优化

  • 索引列上使用表达式或者函数,无法使用索引

1.优化策略

(1)前缀索引和索引列的选择性:

  • Innodb 的索引的最大宽度 767 字节,换算到 utf8 中是 255 个字符
  • MyISAM 的索引的最大宽度是 1000 字节
  • 所以创建列的前缀索引更节约空间,有效利用索引
  • 创建方式 CREATE INDEX index_name ON table_name(col_name(n)) 其中 n 就是对 col_name 列索引的宽度
  • 前缀索引以不降低索引的选择性为准
  • 索引的选择性:不重复的索引值和表的记录数的比值,索引唯一性越高选择性越高

(2)联合索引

选择索引列的顺序

  • 经常会被使用到的列优先
  • 选择性高的列优先
  • 选择性差的索引不宜放在前面,索引优化器不一定会使用(如:status(1,2,3)这种列)
  • 宽度小的列优先使用

(3)覆盖索引

即查询的列中包含了被索引的列的

Extra 中 Using index 指 select 中的 last_name 使用了覆盖索引(last_name 有索引 idx_actor_last_name)

优点

  • 可以优化缓存,减少磁盘 IO 操作
  • 可以减少随机 IO,变随机 IO 为顺序 IO
  • 可以避免对 Innodb 主键索引的二次查询
  • 可以避免 MyISAM 表进行系统调用

无法使用覆盖索引

  • 存储引擎不支持覆盖索引(memery 不能使用,Hash 索引不能作为覆盖索引使用)
  • 查询中使用了太多的列(比如 select * 就无法使用)
  • 使用了双 % 号的 like 查询

(4)使用索引优化查询

使用索引扫描优化排序

  • 索引列的顺序和 order by 子句的顺序完全一致
  • 索引中所有列的方向(升序、降序)和 order by 子句完全一致(联合索引中的两列,在 order by 中方向不一致时,无法使用索引)
  • order by 中的字段全部在关联表的第一张表中

B-tree 索引模拟 Hash 索引优化查询(Innodb 不能直接使用 Hash 索引)

  • 方式:简历一个字段的 md5 后值的字段,并对其建立索引,之后使用触发器等对其进行维护,查询时 where xxx_md5 = md5('nnnn') and xxx = 'nnn',后面条件用于避免 Hash 冲突
  • 只能处理键值的全值匹配查找
  • 所使用的 Hash 函数决定着索引建的大小(如上 md5 的字段是 32 位)

(5)利用索引优化锁

  • 索引可以减少锁的行数
  • 索引可以加快处理速度,同时也加快了所的释放

(6)索引的维护和优化

  • 删除重复和冗余的索引(主键索引过的字段不需要再加入联合索引中,因联合索引会自动引用主键索引)
  • 使用工具查找:pt-duplicate-key-checker h=127.0.0.1
  • 查找未被使用过的索引,删除不需要的
  • 查找 SQL:SELECT object_schema,object_name,index_name,b.\ TABLE_ROWS` FROM performance_schema.table_io_waits_summary_by_index_usage a JOIN information_schema.tables b ON a.`OBJECT_SCHEMA`=b.`TABLE_SCHEMA` AND a.`OBJECT_NAME`=b.`TABLE_NAME` WHERE index_name IS NOT NULL AND count_star = 0 ORDER BY object_schema,object_name;`
  • 更新索引系统信息及减少索引碎片,更新索引:analyze table table_name,整理碎片:optimize table table_name
  • 索引
    24 引用 • 28 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    692 引用 • 535 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    728 引用 • 1273 回帖 • 1 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 232 回帖
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 140 关注
  • 智能合约

    智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。

    1 引用 • 11 回帖 • 2 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 1 关注
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 63 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    142 引用 • 442 回帖 • 1 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    288 引用 • 734 回帖 • 2 关注
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖 • 2 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    107 引用 • 295 回帖
  • 导航

    各种网址链接、内容导航。

    42 引用 • 175 回帖
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 1 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖 • 1 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    210 引用 • 2036 回帖
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 335 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    53 引用 • 37 回帖 • 3 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 559 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 635 关注
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 172 关注
  • 自由行
    4 关注
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    167 引用 • 1520 回帖
  • gRpc
    11 引用 • 9 回帖 • 69 关注
  • Sym

    Sym 是一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)系统平台。

    下一代的社区系统,为未来而构建

    524 引用 • 4601 回帖 • 700 关注