私はnutchとsolrが初めてです。Nutch を使用して Web サイトをクロールし、solr を使用してこれらのページのインデックスを作成しています。solr データベースのリンクのコンテンツを取得する方法はありますか?
例えば
- http://www.prova.com/prova.htmlにインデックスを付けている場合
- このページには「これは新しいページです」というテキストが含まれています
- solrで、どこかに保存されたテキストページはありますか?
ありがとう
ダニーロ
私はnutchとsolrが初めてです。Nutch を使用して Web サイトをクロールし、solr を使用してこれらのページのインデックスを作成しています。solr データベースのリンクのコンテンツを取得する方法はありますか?
例えば
ありがとう
ダニーロ