data-structures - リレーショナルデータベースシステムで使用されるデータ構造

Question

入力する実際のデータ、名、姓などを格納するために RDBMS で使用されるデータ構造は何か、インデックス作成などには B および B+ ツリーが効率的であることはわかっていますが、これについての適切な回答は得られていません。私の無知を許してください。

score 11 · Accepted Answer

これは通常、ストレージエンジン次第であり、生データはデータベースデータのさまざまな分類のために保存されます。そのうち少なくとも 3 つの一般的な区分があります。

ここに記載する情報のほとんどは、MySQL の知識に基づいています。

インデックス

たとえば、MySQLには次のようないくつかのがあります。

私が知る限り、InnoDB と MyISAMは B ツリーインデックスを使用しますが、メモリストレージエンジンでは B ツリーまたはハッシュインデックスを指定できます。

ドキュメントには、それぞれの使用方法を比較するページも含まれています。

他の RDBMS は独自の仕様を使用する予定ですが、B ツリーが一般的だと思います。

通常、インデックスはそれ自体の小さなテーブルのようになります。インデックス値は主キーであり、値はその値を含む行の主キーのリストです。

この答えもまた複雑で、ストレージエンジン次第です。実装の詳細に興味がある場合は、ストレージエンジンを参照してください。

行は、主キーによってすばやく検索できるデータ形式で格納されます。^{通常、行には比較的小さい (2 16}バイトと考えてください) 固定制限があり、その後、さらにデータが拡張データページにプッシュされるため、速度が向上します。

主キーは常に索引付けされ、その他の値はオプションで索引付けできます。そうでない場合、ストレージエンジンがそれらを見つける唯一の方法は「テーブルスキャン」です。文字通り、すべてのデータをループして、列の値と探している値を比較します。

BLOB データは、行の主キーによって検索できること以外に、特別なインデックスプロパティを持たない大きなファイルシステムのようなものだと考えてください。また、行ごとに割り当てられる固定スペースの利点も失われます。これは、大量の任意の量のデータを格納できるというトレードオフです。