背景
用过MySQL
的同学都知道高效查询需要走索引,否则全表读取会导致慢SQL。InnoDB
的索引是采用B+树
实现的。网络和书本上关于B+树
的定义各不相同,读者们可能都分辨不清哪个是准确的定义。
定义
笔者按照《数据库系统概念》(Database System Concepts)这本书上的概念,准确定义B+树
。
B+树
采用的是平衡树结构,从根节点到每个叶子节点的路劲长度都是相同的,我们给每棵树定义n
,n
是固定不变的,下图是B+树
节点全满状态的结构:
P表示指针,K表示关键字,且如果i < j
,则Ki < Kj
(假设没有重复的关键字)。
对于叶节点,i = 1,2,···,n-1
, 指针Pi
指向具有关键字Ki
的一条文件记录,指针Pn
指向后一个叶节点,这样所有的叶节点按键值大小顺序串成一个链表,可以高效地进行顺序处理。
非叶节点的结构与叶节点相同,只不过非叶节点的指针都是指向树中的节点。假设有Ki-1,Pi,Ki
,则指针Pi
指向的子树中的关键字值大于等于Ki-1
,小于Ki
;P1
指向的子树的关键字值,小于K1
;Pn
指向的子树的关键字值都大于等于Kn-1
。
对任意节点,指针数 = 关键字数 + 1
对于任意非叶节点,其指针数必须满足
[ceil(n/2), n]
若非叶节点是根节点,则其指针数可以小于
ceil(n/2)
,但至少包含两个指针,除非整棵树只有一个节点对于任意叶节点,其关键字数必须满足
[ceil((n-1)/2), n-1]
若叶节点是根节点,则其关键字数可以小于
ceil((n-1)/2)
更新
关于B+
树的查找、插入、删除操作,请参考本人github
:
https://github.com/butterflyl...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。