0

転置索引を構築する際、検索エンジンでの基本語の選択にルールがあるのだろうかと思いました。通常、ストップ ワードはインデックスに登録されないことを知っています。しかし、他の人はどうですか?混乱しています...よろしくお願いします。

4

1 に答える 1

0

ステミングっていうんですか?一部の検索エンジンはそれを使用しています。これは、すべての単語が切り捨てられることを意味するためwalkwalks、 、walkedおよびwalkingはすべて として索引付けされwalkます。検索を実行する前に、同じことがクエリに適用されます。walking in the woodsを検索すると「a」にもマッチするため、より多くのヒットが得られますwalk in the woods

于 2013-04-22T13:54:24.120 に答える