Nutchを使用してサイトを正常にクロールし、Solrをインデクサー/サーチャーとして使用して強調表示された要約を返そうとしています。したがって、「ocean」をクエリする場合、そのクエリ用語を含むWebページのテキスト(タイトルやURLではない)だけから20〜30語の要約を返したいと思います。
Nutchschema.xmlをSolrschema.xmlとしてコピーしました。
したがって、2つの質問があります。1。Nutch schema.xmlの「content」フィールドはWebページの本文要素のフィールドですか?2.このフィールドが保存されていない場合、Solrに検索時にそのフィールドを取得させて、強調表示できるようにする方法はありますか?