2

Nutch 1.6 を Solr 4.3 と統合しようとしています (/apache-nutch-1.6/conf/schema-solr4.xml を collection1/conf/ にコピーし、ファイルの名前を schema.xml に変更しました)。また、Nutch1.5.1 を solr 4.3 と統合しようとしました。どちらの状況でも、実行時に IOException が発生します。

bash$ nutch crawl urls -solr http://127.0.0.1:8983/solr/

ジョブが失敗しました。何か案は?

solr.logを見て、以下のこれらのフィールドをcollection1/confの下のschema.xmlに追加する必要があると私は考えました

<field name="host" type="string" stored="false" indexed="true"/> <field name="segment" type="string" stored="true" indexed="false"/> <field name="digest" type="string" stored="true" indexed="false"/> <field name="boost" type="float" stored="true" indexed="false"/> <field name="tstamp" type="date" stored="true" indexed="false"/> そしてそれはうまくいきました。

4

2 に答える 2

0

vera、私はnutch 1.7とsolr 4.4.0を使用しています。schema.xml ファイルに問題がありました。私は変更が以下にあるスキーマファイルのいくつかの変更を見つけます

usr/nutch 1.7/conf/ schema.xml をコピーして /usr/local/solr-4.4.0/example/solr/collection1/conf/schema を貼り付け、フィールド type="text" を text_field ではなく変更した後に上書きします。への変更

content= text クラスは、その englishPorterFilterFactory を SnowballPorterFilterFactory に変更します

追加後

field name=" version " type="long" indexed="true" stored="true"

field name="text" type="text" indexed="true" stored="false" multiValued="true"

それは私にとってはうまくいきます..

于 2013-09-12T07:32:09.700 に答える
0

はい、ログから詳細を追加していただけますか。考えられる原因は、schema.xml ファイルで uniquekey を定義する必要があることです。このような

<uniqueKey>id</uniqueKey>.
于 2013-05-22T15:38:29.863 に答える