2

私が理解しているように、ハッシュ/逆インデックスは、値/単語をそれぞれレコード/ドキュメントにマップします。ただし、ハッシュ インデックスでの挿入の複雑さは低くなりますが (オーバーフローの場合に新しいバケットが追加されるため)、逆インデックスではより複雑になります (ドキュメント ID の並べ替えられたリストを維持するため)。実装を除いて、それらは本質的に同じであることを意味しますか?

4

2 に答える 2

1

私が理解していることから、ハッシュインデックスは、逆インデックスとはまったく異なるユースケース/シナリオに使用されます。ハッシュ インデックスは、メモリ内の特定の行の正確な位置へのインデックス キーからの単なるマッピングです (リレーショナル データベースのメモリ最適化テーブルに主に使用されます) が、逆インデックスは実際には単語からドキュメントへのマッピングです。含まれています。

したがって、これを見ると、1 つの単語が多数の文書に含まれている可能性があり、その文書は多くのそのような単語によって共有されている可能性があります。したがって、転置インデックスの場合、多くのキーはそのような多くのキーで共通のドキュメント ID を指しますが、ハッシュ インデックスの場合、キーが指すデータ、つまり行データは互いに完全に無関係である可能性があります。

したがって、それらはまったく無関係なシナリオに対処するため同じではなく、実装方法も大きく異なります。

転置インデックスの詳細については、次の記事を参照してください: BigData: Inverted Index

于 2015-09-28T03:24:23.387 に答える