SQL查询慢如蜗牛？索引失效的N个坑，这样避免！

2025/5/10 18:33:35 260 0 0 0

作为一名数据库开发，有没有遇到过这样的场景？测试环境风驰电掣，一到生产环境，SQL查询就慢如蜗牛，用户疯狂投诉！

罪魁祸首之一，就是——索引失效！

索引，好比字典的目录，能帮你快速找到目标数据。但如果目录用错了，或者根本没用目录，那找起来可就费劲了。这篇文章，我就来扒一扒索引失效的常见原因，并给出相应的避坑指南，让你写出高效的SQL，告别慢查询！

1. 模糊查询的陷阱：`LIKE` 语句的左模糊匹配

问题描述：

当你使用 LIKE '%keyword' 或 LIKE '%keyword%' 进行模糊查询时，索引会失效。这是因为索引是按照顺序排列的，左模糊匹配会导致无法利用索引的顺序性进行查找，数据库不得不进行全表扫描。

原因分析：

B-Tree 索引的结构特点决定了它只能高效地处理前缀匹配的查询。当 LIKE 语句以 % 开头时，无法确定查询的起始位置，导致索引失效。

避坑指南：

尽量避免左模糊匹配： 如果必须使用模糊查询，尽量将 % 放在右边，例如 LIKE 'keyword%'。这样可以利用索引的前缀匹配能力。
使用全文索引： 对于需要进行复杂模糊查询的场景，可以考虑使用全文索引。全文索引专门用于处理文本搜索，可以高效地支持各种模糊匹配。
数据量较小时，可接受全表扫描： 如果数据量很小，全表扫描的性能影响不大，可以不使用索引。

举例说明：

假设有一个 users 表，其中 name 字段建有索引。

-- 索引失效
SELECT * FROM users WHERE name LIKE '%张三';

-- 索引生效
SELECT * FROM users WHERE name LIKE '张三%';

2. 数据类型不匹配：隐式类型转换的坑

问题描述：

当查询条件中的数据类型与索引列的数据类型不匹配时，数据库可能会进行隐式类型转换，导致索引失效。例如，索引列是字符串类型，而查询条件是数字类型。

原因分析：

隐式类型转换会导致数据库无法直接使用索引进行查找，而是需要先将索引列的值转换为与查询条件相同的数据类型，然后再进行比较。这个转换过程会增加额外的开销，导致索引失效。

避坑指南：

保持数据类型一致： 确保查询条件中的数据类型与索引列的数据类型完全一致。
显式类型转换： 如果必须进行类型转换，使用显式类型转换函数，例如 CAST 或 CONVERT。

举例说明：

假设有一个 orders 表，其中 order_id 字段是字符串类型，建有索引。

-- 索引失效，因为 '123' 是字符串，而 order_id 是数字
SELECT * FROM orders WHERE order_id = 123;

-- 索引生效，使用显式类型转换
SELECT * FROM orders WHERE order_id = CAST(123 AS CHAR);

3. 运算符使用不当：`<>`、`!=`、`NOT IN` 的诅咒

问题描述：

在查询条件中使用 <>、!=、NOT IN 等否定运算符时，索引通常会失效。这是因为这些运算符无法利用索引的顺序性进行查找，数据库不得不进行全表扫描。

原因分析：

B-Tree 索引擅长处理等值和范围查询，但对于否定查询，它无法有效地利用索引。数据库需要扫描整个索引才能找到所有不满足条件的数据。

避坑指南：

尽量避免使用否定运算符： 尽量使用等值或范围查询来代替否定查询。
使用 IN 代替 NOT IN： 如果必须使用否定查询，可以尝试使用 IN 运算符，并列出所有需要排除的值。
考虑其他方案： 对于复杂的否定查询，可以考虑使用其他方案，例如子查询或临时表。

举例说明：

假设有一个 products 表，其中 category_id 字段建有索引。

-- 索引失效
SELECT * FROM products WHERE category_id <> 1;

-- 索引失效
SELECT * FROM products WHERE category_id NOT IN (1, 2, 3);

-- 尝试使用 IN 代替 NOT IN（如果能列出所有 category_id）
SELECT * FROM products WHERE category_id IN (4, 5, 6, 7, 8, 9, 10);

-- 更好的方案：如果可能，避免否定查询，尝试找出需要的数据
SELECT * FROM products WHERE category_id > 1;

4. 函数的使用：索引列上的函数调用

问题描述：

在查询条件中对索引列使用函数，会导致索引失效。这是因为数据库无法直接使用索引中的值进行计算，而是需要先对索引列的值进行函数计算，然后再进行比较。

原因分析：

索引存储的是原始数据，而不是函数计算后的结果。当在查询条件中使用函数时，数据库无法利用索引的顺序性进行查找，只能进行全表扫描。

避坑指南：

避免在索引列上使用函数： 尽量将函数计算移到查询条件之外。
使用预计算列： 如果必须使用函数计算，可以考虑创建一个预计算列，将函数计算的结果存储在该列中，并对该列建立索引。

举例说明：

假设有一个 users 表，其中 birthday 字段是日期类型，建有索引。

-- 索引失效
SELECT * FROM users WHERE YEAR(birthday) = 2000;

-- 索引生效，将函数计算移到查询条件之外
SELECT * FROM users WHERE birthday >= '2000-01-01' AND birthday < '2001-01-01';

-- 使用预计算列（如果经常需要按年份查询）
ALTER TABLE users ADD COLUMN birth_year INT;
UPDATE users SET birth_year = YEAR(birthday);
CREATE INDEX idx_birth_year ON users (birth_year);
SELECT * FROM users WHERE birth_year = 2000;

5. 联合索引：不满足最左前缀原则

问题描述：

对于联合索引，如果查询条件没有包含索引的最左列，或者没有按照索引的顺序使用索引列，索引会失效。

原因分析：

联合索引是按照索引列的顺序进行排序的。只有当查询条件包含索引的最左列，并且按照索引的顺序使用索引列时，才能利用索引的顺序性进行查找。

避坑指南：

满足最左前缀原则： 确保查询条件包含索引的最左列，并且按照索引的顺序使用索引列。
调整索引列的顺序： 如果经常需要根据某些列进行查询，可以将这些列放在索引的最左边。

举例说明：

假设有一个 orders 表，其中 (user_id, order_date, status) 字段建有联合索引。

-- 索引生效
SELECT * FROM orders WHERE user_id = 1;
SELECT * FROM orders WHERE user_id = 1 AND order_date = '2023-10-26';
SELECT * FROM orders WHERE user_id = 1 AND order_date = '2023-10-26' AND status = 'shipped';

-- 索引失效，没有包含最左列 user_id
SELECT * FROM orders WHERE order_date = '2023-10-26';
SELECT * FROM orders WHERE status = 'shipped';

-- 索引部分生效，使用了 user_id，但 order_date 和 status 的索引失效，因为跳过了 order_date
SELECT * FROM orders WHERE user_id = 1 AND status = 'shipped';

6. 索引列区分度低：性别、状态等字段

问题描述：

如果索引列的区分度很低，例如性别、状态等字段，索引的效果会很差，甚至不如全表扫描。这是因为这些字段的取值范围很小，索引的选择性很低。

原因分析：

索引的选择性是指索引列中不同值的数量与表记录总数的比值。选择性越高，索引的效果越好。当索引列的区分度很低时，索引的选择性也很低，数据库需要扫描大量的索引页才能找到目标数据，甚至不如直接进行全表扫描。

避坑指南：

避免在区分度低的列上建立索引： 对于性别、状态等字段，通常不建议建立索引。
联合索引： 如果需要根据区分度低的列进行查询，可以考虑与其他区分度高的列建立联合索引。

举例说明：

假设有一个 users 表，其中 gender 字段只有两个取值：男、女。

-- 索引效果很差，甚至不如全表扫描
CREATE INDEX idx_gender ON users (gender);
SELECT * FROM users WHERE gender = '男';

-- 联合索引，效果更好（假设 name 字段区分度较高）
CREATE INDEX idx_gender_name ON users (gender, name);
SELECT * FROM users WHERE gender = '男' AND name LIKE '张%';

7. OR 连接条件：可能导致全表扫描

问题描述：

当使用 OR 连接多个查询条件时，如果 OR 前后的列都使用了索引，可能会导致索引失效，数据库选择全表扫描。

原因分析：

MySQL 的优化器在某些情况下，会认为使用多个索引分别查询，然后合并结果集的成本，高于全表扫描。特别是当 OR 连接的条件比较复杂，或者每个条件的选择性都不高时，更容易出现这种情况。

避坑指南：

使用 UNION ALL 代替 OR： 将 OR 连接的查询拆分成多个独立的查询，然后使用 UNION ALL 合并结果集。这样可以确保每个查询都能够使用索引。
确保 OR 前后条件都有索引： 确保 OR 连接的每个条件都能够使用索引，避免出现全表扫描。
强制使用索引： 可以使用 FORCE INDEX 提示 MySQL 优化器使用索引。

举例说明：

假设有一个 products 表，其中 name 和 category_id 字段都建有索引。

-- 可能导致索引失效
SELECT * FROM products WHERE name LIKE '张%' OR category_id = 1;

-- 使用 UNION ALL 代替 OR
SELECT * FROM products WHERE name LIKE '张%'
UNION ALL
SELECT * FROM products WHERE category_id = 1;

-- 强制使用索引（不推荐，除非你非常确定）
SELECT * FROM products FORCE INDEX (idx_name, idx_category_id) WHERE name LIKE '张%' OR category_id = 1;

8. 统计信息不准确：MySQL 优化器的误判

问题描述：

MySQL 的优化器会根据表的统计信息来选择最优的执行计划。如果统计信息不准确，优化器可能会做出错误的判断，导致索引失效。

原因分析：

表的统计信息包括表的记录数、索引的基数（不同值的数量）等。这些信息会影响优化器对查询成本的估算。如果统计信息过时或不准确，优化器可能会选择错误的索引，或者直接选择全表扫描。

避坑指南：

定期更新统计信息： 使用 ANALYZE TABLE 命令定期更新表的统计信息。特别是在数据量发生较大变化后，一定要及时更新统计信息。

举例说明：

-- 更新 products 表的统计信息
ANALYZE TABLE products;

9. 硬件资源限制：内存不足、IO 瓶颈

问题描述：

即使 SQL 语句写得很好，索引也正确使用了，但如果服务器的硬件资源不足，例如内存不足、IO 瓶颈等，也可能导致查询性能下降，甚至出现“索引失效”的假象。

原因分析：

当内存不足时，MySQL 无法将所有需要的索引页加载到内存中，导致频繁的磁盘 IO，降低查询速度。当磁盘 IO 出现瓶颈时，即使索引在内存中，也无法快速读取数据。

避坑指南：

优化硬件配置： 增加服务器的内存、升级磁盘 IO，提高硬件性能。
优化 MySQL 配置： 调整 MySQL 的配置参数，例如 innodb_buffer_pool_size，增加 InnoDB 缓冲池的大小，减少磁盘 IO。

10. 其他原因：版本 BUG、死锁等

除了以上常见的索引失效原因外，还有一些其他因素可能导致索引失效，例如：

MySQL 版本 BUG： 某些版本的 MySQL 存在 BUG，可能导致索引失效。升级到最新版本可以解决这些问题。
死锁： 死锁会导致事务阻塞，影响查询性能。
锁冲突： 锁冲突会导致查询等待锁释放，降低查询速度。

总结：

索引失效是一个常见的问题，但只要我们了解其背后的原因，并采取相应的措施，就可以有效地避免索引失效，写出高效的 SQL 语句，提升数据库的性能。记住，优化 SQL 是一个持续的过程，需要不断学习和实践。希望这篇文章能帮助你更好地理解和解决索引失效的问题。

SQL猎人索引失效 SQL优化数据库性能

SQL查询慢如蜗牛？索引失效的N个坑，这样避免！

1. 模糊查询的陷阱：LIKE 语句的左模糊匹配

2. 数据类型不匹配：隐式类型转换的坑

3. 运算符使用不当：<>、!=、NOT IN 的诅咒

4. 函数的使用：索引列上的函数调用

5. 联合索引：不满足最左前缀原则

6. 索引列区分度低：性别、状态等字段

7. OR 连接条件：可能导致全表扫描

8. 统计信息不准确：MySQL 优化器的误判

9. 硬件资源限制：内存不足、IO 瓶颈

10. 其他原因：版本 BUG、死锁等

评论点评

1. 模糊查询的陷阱：`LIKE` 语句的左模糊匹配

3. 运算符使用不当：`<>`、`!=`、`NOT IN` 的诅咒