1

私は初めての Solr ユーザーで、v3.5 を Windows 7 システムの Tomcat 7 で使用しています。example-docs の XML の例を問題なく実行しました。ただし、HTML および PDF ファイルで抽出を使用する必要があります。インデックス作成のために PDF ファイルを投稿しようとすると、次のようになります。

SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8080/solr/update/extract?literal.id=doc2..
SimplePostTool: POSTing file test.pdf
SimplePostTool: FATAL: Solr returned an error #500 Internal Server Error

私が使用したコマンドは次のとおりです。

java -Durl=http://localhost:8080/solr/update/extract?literal.id=doc2 -Dtype=application/pdf -jar post.jar test.pdf

私のsolrホームディレクトリはC:\ solrで、これまでに次のことを行いました:

  • solr ダウンロード パッケージの example/solr フォルダーの内容をコピーしました
  • solr ダウンロード パッケージの contrib/extraction/lib フォルダーを C:\solr\lib にコピーしました
  • solr ダウンロード パッケージの dist/apache-solr-cell-3.5.0.jar を C:\solr\dist\apache-solr-cell-3.5.0.jar にコピーしました。
  • C:\solr\conf\solrconfig.xml の適切な「lib」タグを<lib dir="lib" />およびに変更しました。<lib dir="dist/" regex="apache-solr-cell-\d.*\.jar" />

PDF および HTML ファイルでこれを機能させるには、他に何をする必要がありますか? 複数のチュートリアルと「Getting Started」ガイドを読みましたが、何が問題なのか理解できません。私はTomcatの初心者でもあり、私が知る限り、これはTomcatのログに表示されていません...だから私はほとんど立ち往生しています. 繰り返しますが、XML の例に問題はありません。したがって、Tomcat 自体は正常に動作しており、solr を認識しています (solr 管理ページが表示されます)。どんな助けでも大歓迎です。

4

0 に答える 0