1

Nutch と Solr を使い始めたばかりです。シード URL を 1 つだけ使用してクロールを 1 回実行しました。このコマンドを実行しました:

bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5

すべてがうまくいき、Solr がページのインデックスを作成していると思いますか? では、どうやって検索するのでしょうか?私はここに行きましたlocalhost:8983/solr/admin/しかし、検索クエリを入力して検索をクリックすると、次のようになります。

HTTP ERROR 400
Problem accessing /solr/select/.
Reason: undefined field text

チュートリアルの例も試しましたが、このコマンドを実行すると:

java -jar post.jar solr.xml monitor.xml

私はこれを得る:

SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8983/solr/update..
SimplePostTool: POSTing file solr.xml
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name'

私の最終的な目標は、何らかの方法でこのデータを Accumulo に追加し、検索エンジンに使用することです。

4

1 に答える 1

2

Nutch 1.4 以降を使用していると仮定しています。その場合は、solr/conf/schema.xml ファイルに追加したフィールドのタイプを、引用符なしで「text」から「text_general」に変更する必要があります。

私は現在、同様の目標に向けて取り組んでおり、その修正を使用して、少なくとも solr が適切に機能するようにしましたが、solr でインデックス付きサイトを検索することはまだできません。これが役に立てば幸いです。動作するようになったらお知らせください。

于 2012-06-21T22:17:12.403 に答える