2

検索インデックスとデータベース インデックスの違いは何だろうと思っていました。DB インデックス作成では実際のデータへのソートされたポインターを使用し、検索インデックス作成 (たとえば、逆インデックスを使用) ではハッシュテーブルのような構造を使用して、その単語を含むドキュメントに単語をマップすることを認識しています。インデックス作成は、両方のシナリオで異なることを意味します。私の質問は - 両方のケースが本当に違うのですか? DB インデックス作成と検索インデックス作成は異なる概念ですか? ここで「インデックス作成」という言葉に混乱しているだけだと思います。これについての明確さは高く評価されます。

4

1 に答える 1

2

データベースのインデックス作成は、ターゲット アプリケーションからのクエリによって実行されます。通常、データベースを設計し、インデックスを作成する属性を決定する際には、明確な要件があります。たとえば、属性 A が DB でインデックス化されている場合、属性 A に対する既知の潜在的なクエリ Q (または一連のクエリ) を高速化することを目的としています。

一方、Web 検索 (またはキーワード検索) はより自由な形式です。検索エンジンがドキュメント (Web ページ) のインデックスを作成するとき、クエリに関する事前情報はありません。そのため、ドキュメントを (自然言語処理によって) 理解し、関心のあるキーワードやフレーズをインデックス化する必要があります。

検索インデックス作成とデータベース インデックス作成には多くの一般的な手法がありますが、要件は異なります。I/O の効率と一貫性は、DB インデックス作成の最大の関心事です。一方、検索用のインデックスは、スケーラビリティとスペース効率を優先します (分散と並列処理によって時間効率が達成されます)。また、検索インデックス作成では、一致するすべてのドキュメントを呼び出す必要はありません。ほとんどの場合、数百の上位ランクのエントリを取得するだけで十分です。

于 2013-03-31T08:41:20.103 に答える