MySQL 哈希索引

哈希索引基于哈希表实现，只有精确匹配索引所有列的查询才有效。

在MySQL中只有Memory引擎显示支持哈希索引，也是memory引擎表的默认索引类型。memory引擎是支持非唯一哈希索引的。如果多个列的哈希值相同，索引会以链表的方式存放多个记录指针道同一个哈希条目中。

举个粒子:

create table testhash(
fname varchar(50) not null,
lname varchar(50) not null,
key using hash(fname)
)engine=memory;


数据库中的数据：
mysql> select * from testhash;
+--------+-----------+
| fname  | lname     |
+--------+-----------+
| Baron  | Schwartz  |
| Arjen  | Lentz     |
| Peter  | Zaitsev   |
| Vadim  | Tkachenko |
+--------+-----------+
4 rows in set (0.00 sec)

假设f() 为哈希函数，f(fname) 的返回值是其哈希值，对应槽位。槽位是按顺序排列的。每个槽位上的值指向数据。
（结构可以理解为 jdk 1.7 中的hashmap的数据结构，一个数组和链表的形式）

ERROR 1054 (42S22): Unknown column 'lane' in 'field list'
mysql> select lname from testhash where fname ='Peter';
+---------+
| lname   |
+---------+
| Zaitsev |
+---------+
1 row in set (0.00 sec)

查找的过程是是先计算'Peter'的哈希值，并使用改值寻找对应的记录指针，也就是计算f('Peter')，得到其哈希值为 3468 ，然后在对应的槽位上找到记录指针，找到对应行上的数据，最后一步是比较查找的值是否为'Peter' ，以确保就是要查找的行。

哈希索引的限制

哈希索引值包含哈希值和行指针，而不存储字段值，所以不能使用索引中的值来避免读取行。
哈希索引数据并不是按照索引值顺序存储的，所以无法用于排序
哈希索引也不支持部分索引匹配查找，因为哈希索引始终是使用索引列的全部内容来计算哈希值。例如，在数据列(A,B）上简历哈希索引，如果查询只有数据列A，则无法使用该索引。
哈希索引只支持等值比较查询，包括 =、IN() 、<=> ,也不支持任何范围查找，例如 where price > 100.
访问哈希索引的数据非常快，除非欧很多哈希冲突。当出现哈希冲突的时候，存储引擎必须遍历链表中的行指针，装进行比较，直到找到所有符合条件的行。
如果哈希冲突很多的时候，一些索引维护操作的代价也会非常高。例如，如果在某个选择性很低（哈希冲突很多）的列上建立哈西索引，那么当从表中删除一行时，存储引擎需要遍历对应哈希值的链表中的每一行，找到并删除对应行的引用，冲突越多，代价越大。

InnoDB引擎有一个特殊的功能叫做"自适应哈希索引。当InnoDB注意到某些索引值被引用得非常频繁时，他会在内存中基于B-Tree索引智商在创建一个哈希索引，这样就让B-Tree索引也具有哈希索引的一些优点。这是一个完全自动的、内部的行为，用户无法控制或配置。不过如果有必要，完全可以关闭该功能。

MySQL 哈希索引

林慫慫

引用和评论

注解入门

Open WebUI：开源AI交互平台的全面解析

被 Manus 带火的 MCP 是什么｜一文看懂

MySQL × 向量数据库：大模型时代的黄金组合实战指南

百万级群聊的设计实践

分布式数据库解析

MySQL Binlog 深度解析