B TreeとB+ Treeの違い

概要

インデックスに対してMongoDBはB Treeを採用し、MySQLのInnoDBはB+ Treeを採用しています。
どうして採用しているアルゴリズムが違うのだろう？と思って調べてみました。

B+ TreeはほとんどB Treeと同じですが、以下の点が異なります。

・リーフノードとリーフノードを結ぶポインタがある
・データはリーフノードのみに保持する

言葉だけだと分かりにくいので、Visualizeするツールを使って具体例を表示します。

先程のB Treeと違って、データはリーフノードに持つので、途中の子ノードとリーフノードで同じキーがあることが分かります（2、5、15など）

この画像が非常に分かりやすいです。

リーフノードがポインタでつながっているので、範囲検索に強い（リーフノードのみ見ればいい）
子ノードがキーしか持たないため、ページ（ブロック）に載せられるキーが多い。つまりOrderが高くなるため、Treeの階層が少なくなり計算量が減る。
- ロジック上無理やりOrderを高くすることは出来るが、その場合複数のブロックにキーが分散して存在することになる。つまり各ブロックにアクセスするためI/Oが増え、結果的に処理が遅くなる。