0

Apache Nutchを使用してWebサイトをクロールし、Solrにインデックスを付けました。Webサイトのすべてのページに同じタイトルがあり、さらに結果はコンテンツフィールドでのみ見つかりました。次に、次のようなフィールドをブーストできません:content ^ 0.5 title ^ 2結果が完全にコンテンツフィールドにあるため、すべてのページにh2 htmlタグのフレーズが存在し、フレーズ(h2 htmlタグ内)の場合はドキュメントをブーストしたい)それを検索した単語が含まれています。どうすればよいですか?

4

1 に答える 1

0

Edismax (拡張されたDismax ) パーサーを使用して、一致に応じて結果をブーストできます。
個々の用語の一致 (qf と qs)、フレーズ slop とのフレーズの一致 (ps と ps)、シングルの一致 (pf2 と pf2) に基づいて一致をブーストすることができます。
関連性に応じて一致をブーストするように要求ハンドラーを構成できます。

于 2012-08-15T06:45:15.503 に答える