Nutch 1.6 を Solr 4.3 と統合しようとしています (/apache-nutch-1.6/conf/schema-solr4.xml を collection1/conf/ にコピーし、ファイルの名前を schema.xml に変更しました)。また、Nutch1.5.1 を solr 4.3 と統合しようとしました。どちらの状況でも、実行時に IOException が発生します。
bash$ nutch crawl urls -solr http://127.0.0.1:8983/solr/
ジョブが失敗しました。何か案は?
solr.logを見て、以下のこれらのフィールドをcollection1/confの下のschema.xmlに追加する必要があると私は考えました
<field name="host" type="string" stored="false" indexed="true"/>
<field name="segment" type="string" stored="true" indexed="false"/>
<field name="digest" type="string" stored="true" indexed="false"/>
<field name="boost" type="float" stored="true" indexed="false"/>
<field name="tstamp" type="date" stored="true" indexed="false"/>
そしてそれはうまくいきました。