Apache Nutchを使用してWebサイトをクロールし、Solrにインデックスを付けました。Webサイトのすべてのページに同じタイトルがあり、さらに結果はコンテンツフィールドでのみ見つかりました。次に、次のようなフィールドをブーストできません:content ^ 0.5 title ^ 2結果が完全にコンテンツフィールドにあるため、すべてのページにh2 htmlタグのフレーズが存在し、フレーズ(h2 htmlタグ内)の場合はドキュメントをブーストしたい)それを検索した単語が含まれています。どうすればよいですか?
質問する
158 次