B+树的正确姿势

背景

用过MySQL的同学都知道高效查询需要走索引，否则全表读取会导致慢SQL。InnoDB的索引是采用B+树实现的。网络和书本上关于B+树的定义各不相同，读者们可能都分辨不清哪个是准确的定义。

笔者按照《数据库系统概念》（Database System Concepts）这本书上的概念，准确定义B+树。

B+树采用的是平衡树结构，从根节点到每个叶子节点的路劲长度都是相同的，我们给每棵树定义n，n是固定不变的，下图是B+树节点全满状态的结构：

alt text
P表示指针，K表示关键字，且如果i < j,则K_i < K_j(假设没有重复的关键字)。

对于叶节点，i = 1,2,···,n-1, 指针P_i指向具有关键字K_i的一条文件记录，指针P_n指向后一个叶节点，这样所有的叶节点按键值大小顺序串成一个链表，可以高效地进行顺序处理。

非叶节点的结构与叶节点相同，只不过非叶节点的指针都是指向树中的节点。假设有K_i-1,P_i,K_i，则指针P_i指向的子树中的关键字值大于等于K_i-1，小于K_i；P₁指向的子树的关键字值，小于K₁；P_n指向的子树的关键字值都大于等于K_n-1。

关于B+树的查找、插入、删除操作，请参考本人github：