news 2026/2/2 3:43:31

MySQL索引设计避坑指南:这些错误别再犯了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MySQL索引设计避坑指南:这些错误别再犯了

同事写了个SQL,生产环境跑了8秒,被DBA追着骂。

一看执行计划,全表扫描,100万行数据一行行扫。

“不是加了索引吗?”
“加了,但没用上。”

索引这东西,加得不对比不加还糟糕。整理一下常见的索引坑。

一、索引失效的常见场景

1.1 对索引列做函数运算

-- 索引失效SELECT*FROMordersWHEREYEAR(create_time)=2024;-- 索引生效SELECT*FROMordersWHEREcreate_time>='2024-01-01'ANDcreate_time<'2025-01-01';

对索引列用函数,优化器没法用索引。

同理:

-- 失效SELECT*FROMusersWHEREUPPER(username)='ADMIN';-- 如果经常这样查,建函数索引(MySQL 8.0+)CREATEINDEXidx_username_upperONusers((UPPER(username)));

1.2 隐式类型转换

-- phone是varchar类型-- 失效:传入数字,会发生隐式转换SELECT*FROMusersWHEREphone=13812345678;-- 生效:传入字符串SELECT*FROMusersWHEREphone='13812345678';

类型不匹配,MySQL会做隐式转换,相当于对列做了函数操作。

1.3 前导模糊查询

-- 失效SELECT*FROMproductsWHEREnameLIKE'%手机%';-- 生效(前缀匹配)SELECT*FROMproductsWHEREnameLIKE'手机%';

%放前面,没法用B+树的有序性。

解决方案:

  • 用全文索引
  • 用Elasticsearch

1.4 OR条件

-- 假设只有name有索引,age没有-- 失效SELECT*FROMusersWHEREname='张三'ORage=25;-- 解决方案1:给age也加索引-- 解决方案2:改成UNIONSELECT*FROMusersWHEREname='张三'UNIONSELECT*FROMusersWHEREage=25;

OR条件会导致索引失效,除非OR两边的列都有索引。

1.5 不等于条件

-- 可能失效(取决于数据分布)SELECT*FROMordersWHEREstatus!='completed';-- 如果status只有几个值,考虑改成SELECT*FROMordersWHEREstatusIN('pending','processing','failed');

!=NOT IN通常无法利用索引,或者即使用了也是全索引扫描。

二、联合索引的坑

2.1 最左前缀原则

假设有索引:idx_abc (a, b, c)

-- 生效SELECT*FROMtWHEREa=1;SELECT*FROMtWHEREa=1ANDb=2;SELECT*FROMtWHEREa=1ANDb=2ANDc=3;SELECT*FROMtWHEREa=1ANDc=3;-- 只用到a-- 失效SELECT*FROMtWHEREb=2;SELECT*FROMtWHEREc=3;SELECT*FROMtWHEREb=2ANDc=3;

联合索引必须从最左列开始使用,中间不能跳过。

2.2 范围查询后的列失效

-- 索引:idx_abc (a, b, c)-- c用不到索引SELECT*FROMtWHEREa=1ANDb>10ANDc=3;-- 都能用到SELECT*FROMtWHEREa=1ANDb=10ANDc>3;

范围查询(>, <, BETWEEN, LIKE)会终止后续列的索引使用。

设计索引时,把等值查询的列放前面,范围查询的列放后面。

2.3 索引列顺序

-- 查询1:高频SELECT*FROMordersWHEREuser_id=1ANDstatus='pending';-- 查询2:低频SELECT*FROMordersWHEREstatus='pending';-- 正确设计:user_id放前面CREATEINDEXidx_user_statusONorders(user_id,status);-- 如果反过来,查询1能用,但查询1效率差(要扫描很多user_id)

高频查询的条件列放前面,区分度高的列放前面。

三、覆盖索引

3.1 什么是覆盖索引

-- 索引:idx_user_id_name (user_id, name)-- 覆盖索引:查询的列都在索引里,不用回表SELECTuser_id,nameFROMusersWHEREuser_id=1;-- 非覆盖:需要回表取phoneSELECTuser_id,name,phoneFROMusersWHEREuser_id=1;

覆盖索引避免回表,性能更好。

3.2 利用覆盖索引优化COUNT

-- 慢:需要扫描主键索引SELECTCOUNT(*)FROMusers;-- 快:选择最小的二级索引SELECTCOUNT(*)FROMusersFORCEINDEX(idx_status);

MySQL会自动选择最小的索引来COUNT,但有时选错了需要手动指定。

四、索引设计原则

4.1 选择性高的列优先

选择性 = 不重复的值 / 总行数

-- 查看列的选择性SELECTCOUNT(DISTINCTstatus)/COUNT(*)ASstatus_selectivity,COUNT(DISTINCTuser_id)/COUNT(*)ASuser_id_selectivityFROMorders;-- 假设结果-- status_selectivity: 0.0001(5个状态/10万行)-- user_id_selectivity: 0.8(8万用户/10万行)

user_id选择性高,更适合建索引。

status选择性低,单独建索引意义不大。

4.2 短索引优先

-- 对于很长的字符串,可以只索引前缀CREATEINDEXidx_titleONarticles(title(20));-- 确定前缀长度:保证足够的选择性SELECTCOUNT(DISTINCTLEFT(title,10))/COUNT(*)ASsel_10,COUNT(DISTINCTLEFT(title,20))/COUNT(*)ASsel_20,COUNT(DISTINCTtitle)/COUNT(*)ASsel_fullFROMarticles;

前缀索引更短,同样空间能存更多数据,效率更高。

4.3 避免冗余索引

-- 冗余:idx_a已经被idx_ab覆盖CREATEINDEXidx_aONt(a);CREATEINDEXidx_abONt(a,b);-- 不冗余:idx_ba的顺序不同CREATEINDEXidx_abONt(a,b);CREATEINDEXidx_baONt(b,a);

定期检查冗余索引:

-- MySQL 8.0+SELECT*FROMsys.schema_redundant_indexes;

4.4 避免过度索引

索引不是越多越好:

  • 占用磁盘空间
  • 插入/更新/删除都要维护索引
  • 优化器选择困难

一般一个表不超过5-6个索引。

五、EXPLAIN看执行计划

5.1 关键字段

EXPLAINSELECT*FROMordersWHEREuser_id=1;
字段含义关注点
type访问类型const > eq_ref > ref > range > index > ALL
key实际使用的索引是否用到预期索引
rows预估扫描行数越小越好
Extra额外信息Using index好,Using filesort/temporary不好

5.2 常见type解释

-- ALL:全表扫描,最差EXPLAINSELECT*FROMusersWHEREage=25;-- age没索引-- index:全索引扫描EXPLAINSELECTidFROMusers;-- range:范围扫描EXPLAINSELECT*FROMusersWHEREid>100;-- ref:非唯一索引等值查询EXPLAINSELECT*FROMordersWHEREuser_id=1;-- eq_ref:唯一索引等值查询EXPLAINSELECT*FROMusersWHEREid=1;-- const:主键/唯一索引等值,最多一行EXPLAINSELECT*FROMusersWHEREid=1;

5.3 Extra信息

-- Using index:覆盖索引,好-- Using where:用了WHERE过滤,正常-- Using temporary:用了临时表,需要优化-- Using filesort:用了文件排序,需要优化

看到Using temporary或Using filesort,基本都要优化。

六、真实案例

案例1:订单查询优化

原SQL(执行8秒):

SELECT*FROMordersWHEREuser_id=12345ANDstatus='pending'ANDcreate_time>'2024-01-01'ORDERBYcreate_timeDESCLIMIT20;

EXPLAIN显示:

  • type: ALL
  • rows: 1000000
  • Extra: Using where; Using filesort

问题:没用到索引,全表扫描+文件排序。

优化:

-- 建立联合索引CREATEINDEXidx_user_status_timeONorders(user_id,status,create_time);

优化后EXPLAIN:

  • type: range
  • rows: 234
  • Extra: Using index condition

执行时间:8ms

案例2:分页查询优化

原SQL:

SELECT*FROMlogsORDERBYidDESCLIMIT100000,20;

问题:深分页,要扫描10万行再丢弃。

优化方案1:记录上次ID

-- 前端传上一页最小IDSELECT*FROMlogsWHEREid<12345678ORDERBYidDESCLIMIT20;

优化方案2:延迟关联

SELECTl.*FROMlogs lINNERJOIN(SELECTidFROMlogsORDERBYidDESCLIMIT100000,20)AStONl.id=t.id;

子查询只查ID(覆盖索引),再关联取全量数据。

七、运维小技巧

大表加索引会锁表,生产环境要用pt-online-schema-change或gh-ost:

# pt-online-schema-changept-online-schema-change\--alter"ADD INDEX idx_user_id (user_id)"\--execute\D=mydb,t=orders,h=localhost

我们有几个数据库在不同机房,之前同步DDL操作很麻烦。现在用星空组网把几个节点连起来,统一用Ansible批量执行就方便多了。

总结

索引设计核心原则:

原则说明
最左前缀联合索引从左边开始匹配
范围后失效范围查询列放最后
覆盖索引查询列都在索引里最好
选择性区分度高的列建索引
不过度5-6个索引差不多了

索引失效常见原因:

原因解决方案
函数运算改写SQL或建函数索引
类型转换保持类型一致
前导模糊用全文索引/ES
OR条件改UNION或都加索引
不等于改写成IN

索引优化这块经验欢迎交流~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/1 2:19:58

【Open-AutoGLM开源实战指南】:手把手教你快速部署与高效应用

第一章&#xff1a;Open-AutoGLM开源项目概述Open-AutoGLM 是一个面向自动化自然语言处理任务的开源框架&#xff0c;旨在简化大语言模型&#xff08;LLM&#xff09;在实际业务场景中的集成与调优流程。该项目由国内技术团队主导开发&#xff0c;基于 Apache 2.0 许可证发布&a…

作者头像 李华
网站建设 2026/2/1 7:24:25

GoldFactory移动钓鱼攻击中的人脸识别绕过机制与防御对策研究

摘要近年来&#xff0c;针对移动银行应用的高级持续性威胁&#xff08;APT&#xff09;活动日益增多&#xff0c;其中以窃取生物特征数据为核心的攻击手段尤为突出。本文聚焦于Group-IB于2025年披露的GoldFactory移动钓鱼行动&#xff0c;深入剖析其技术架构、攻击链路及对人脸…

作者头像 李华
网站建设 2026/2/1 2:10:23

基于节日社会工程的Storm-0900钓鱼攻击机制与防御策略研究

摘要2025年感恩节前夕&#xff0c;微软披露代号为Storm-0900的威胁组织发起了一场以“停车罚单”和“医疗检测结果”为主题的高伪装度钓鱼攻击。该行动利用节假日期间用户心理松懈与事务处理紧迫性&#xff0c;通过大规模邮件投递诱导受害者访问伪造网站&#xff0c;进而窃取身…

作者头像 李华
网站建设 2026/2/1 12:54:50

2025年西安交通大学计算机考研复试机试真题(附 AC 代码 + 解题思路)

2025年西安交通大学计算机考研复试机试真题 2025年西安交通大学计算机考研复试上机真题 历年西安交通大学计算机考研复试上机真题 历年西安交通大学计算机考研复试机试真题 更多学校题目开源地址&#xff1a;https://gitcode.com/verticallimit1/noobdream N 诺 DreamJudg…

作者头像 李华