プロジェクトにサイト検索を実装しました。Nutch は、サイトのコンテンツのクロールに使用されます。現在、すべてのレコードがクロールされ、SOLR でインデックスが作成されており、検索機能はすべてのキーワード検索で機能します。私たちが直面している問題は、検索結果の関連性です。フィールドでブーストを実行して結果を表示することはできません。
たとえば、フィールドのタイトル、説明、キーワード、URL、およびコンテンツをインデックス化しています。任意のキーワード「XYZ」を検索すると、このキーワードを含むすべてのレコードが用語の頻度に基づいて表示されます。ただし、クエリフィルターでフィールドタイトルをブーストすると、a. タイトル^5 – タイトルにキーワードを含む検索結果が表示されますが、コンテンツに「XYZ」を含むレコードが選択されていません。b. Title^5 content^1.1 – このシナリオでは、検索結果はタイトルの関連性に基づいて表示されず、既定の用語頻度の動作が記録されます。