0

Linux Ubuntu 12.04 がインストールされています。nutch 1.5.1 と solr 3.6.1 をインストールし、テーマを統合してシード URL をクロールしようとしています。このチュートリアルを
使用して、この作業を行います。 3.2 より前の手順に従い、手順4にスキップすると、 localhost:8983/solr/admin/ にアクセスできます。

エラーなし。
しかし、ステップ 6 に進み、nutch の conf フォルダーから solr の example/solr/conf フォルダーに schema.xml をコピーすると、solr/admin ページで以下の Java エラーが発生します。

ページの最初の部分 第二部

どうすればそれを処理できますか?

もう1つ質問があります....これについては別のチュートリアルがありますが、最初のステップでは、 /conf/ および /runtime/local/conf/ フォルダー内の nutch-site.xml ファイルにコードを追加することが言及されています

しかし、nutch フォルダーにはランタイム フォルダーはありません。ステップ 4 では、このフォルダーについても言及しています。なにか提案を?

前もって感謝します

4

2 に答える 2

1

これはほんの少しの赤いニシンです。次のようなバージョン番号を指定する行:

<schema name="nutch" version="1.5.1">

version の値が float として解析されているためです。余分なドットを削除します。1.5 または 1.51 に変更して有効なフロートにし、solr インスタンスを再起動します。例外は消えるはずです。

于 2012-07-31T09:38:07.143 に答える
0

Nutch 1.5.1 と Solr 3.6.1 が互換性があるかどうかを確認してください (同じバージョンの lucene-core と solr-solrj jar がありますか)。互換性のないバージョンでいくつか問題が発生しましたが、 1.5/3.6 では発生しませんでした。

于 2012-07-24T14:54:32.933 に答える