0

だれか教えてください、インデックス サービスにおけるノイズ ワードの正確な意味を教えてください。Windows サーバーのインデックス サービスに取り組んでおり、多くの問題が発生しています。 Some questions on it: Does indexing services not search for noise words? What is the location and name of noise word file on windows server? ありがとう。

4

1 に答える 1

0

それらはストップワードと同じです:

https://en.wikipedia.org/wiki/ストップワード

コンピューティングでは、ストップ ワードは、自然言語データ (テキスト) の処理前または処理後に除外される単語です。すべてのツールが使用するストップ ワードの 1 つの明確なリストはなく、そのようなフィルターが常に使用されるわけではありません。一部のツールは、フレーズ検索をサポートするためにそれらを削除することを特に避けています。

以下も参照してください。

http://msdn.microsoft.com/en-us/library/ms693206%28v=vs.85%29.aspx

ノイズ ワードは、フレーズ クエリのプレースホルダーとして機能します。「wag the dog」というテキストを含むドキュメントは、出現 1 が「wag」、出現 3 が「dog」のインデックスに格納されます。フレーズ クエリ「wag dog」は一致しませんが、フレーズ クエリ「wag a dog」は一致しません。 」は、発生情報が一致するためです

于 2013-12-10T11:44:31.163 に答える