full-text-search - ハッシュインデックスと逆インデックス

Question

私が理解しているように、ハッシュ/逆インデックスは、値/単語をそれぞれレコード/ドキュメントにマップします。ただし、ハッシュインデックスでの挿入の複雑さは低くなりますが (オーバーフローの場合に新しいバケットが追加されるため)、逆インデックスではより複雑になります (ドキュメント ID の並べ替えられたリストを維持するため)。実装を除いて、それらは本質的に同じであることを意味しますか?

score 1 · Accepted Answer

私が理解していることから、ハッシュインデックスは、逆インデックスとはまったく異なるユースケース/シナリオに使用されます。ハッシュインデックスは、メモリ内の特定の行の正確な位置へのインデックスキーからの単なるマッピングです (リレーショナルデータベースのメモリ最適化テーブルに主に使用されます) が、逆インデックスは実際には単語からドキュメントへのマッピングです。含まれています。

したがって、これを見ると、1 つの単語が多数の文書に含まれている可能性があり、その文書は多くのそのような単語によって共有されている可能性があります。したがって、転置インデックスの場合、多くのキーはそのような多くのキーで共通のドキュメント ID を指しますが、ハッシュインデックスの場合、キーが指すデータ、つまり行データは互いに完全に無関係である可能性があります。

したがって、それらはまったく無関係なシナリオに対処するため同じではなく、実装方法も大きく異なります。

転置インデックスの詳細については、次の記事を参照してください: BigData: Inverted Index

full-text-search - ハッシュ インデックスと逆インデックス

2 に答える 2

Related

Reference

full-text-search - ハッシュインデックスと逆インデックス