2

データベースにキーワードのリストがあります。例: Java プログラム、Php プログラムなど。Lucene を使用してこれらのキーワードのインデックスを作成します。キーワード (索引語) よりも長いテキストを検索すると、どのように一致しますか? 例: 「My Java Program is better than yours」を検索しています。キーワード「Java プログラム」を索引付けしたので、一致すると予想されますか? Lucene を使用してこれを効率的に行うには? ルセンでなければ、この種の仕事に他に何が使えますか?

独立したキーワード「java」と「program」で一致させたくないことに注意してください。「Java Program」に一致するものが必要です (インデックスを作成したときと同じように 1 つのキーワードとして)。

ありがとうございました。

4

1 に答える 1

2

StandardAnalyzerを使用してキーワードのインデックスを作成した場合は、次のようなクエリ文字列を使用して非常に効果的にキーワードをクエリできます。

My Java Program is better than yours.

これは、引用符などがない限り、7つのクエリに効果的に解釈されます(ストップワードを削除した後は少なくなります)。したがって、「java」を検索するときと「program」を検索するときに一致します。

于 2012-12-10T20:25:11.890 に答える