3

すべての XML ファイルを他のサーバーに保存し、別のサーバーに SOLR をインストールして構成しました。これらの XML ファイルを SOLR にインデックス化するにはどうすればよいですか。Nutch を確認しましたが、主な目的は html ページをクロールしてインデックスを作成することです。クロールする必要はありません。これらのファイルはすべて、他のサーバーの特定のパスにあります。SOLR でこれらの XML ファイルのインデックスを作成するだけです。SOLR4 をインストールして構成しました。

誰かがこのようなことをしたことがあるなら、その方法を教えてください。ありがとうございました

4

3 に答える 3

2

Solr サーバーからドライブをマウントして、次のようにします。

java -jar post.jar "Z:\home\data\delivery\textarticles.xml"

post.jar は exampledocs フォルダーにあります。これをサンプル アプリケーションとして使用し、独自のアプリケーションを構築して、他のサーバーからこれらの xml ファイルを送信することもできます。

于 2013-01-24T00:21:15.257 に答える
1

DataImportHandlerを見てください。適切な権限が設定されていれば、ネットワーク ファイルにアクセスできるはずです。

于 2013-01-23T21:15:33.433 に答える
0

Shane Alexander の回答に対するコメントに基づいて、DataImportHandler のURLDataSourceオプションを使用して、Url 経由でファイルを取得する必要があります。さらに、認証サポートを可能にするために、 SOLR-1490からのパッチを組み込む必要があります。

于 2013-01-24T12:55:09.077 に答える