私は初めての Solr ユーザーで、v3.5 を Windows 7 システムの Tomcat 7 で使用しています。example-docs の XML の例を問題なく実行しました。ただし、HTML および PDF ファイルで抽出を使用する必要があります。インデックス作成のために PDF ファイルを投稿しようとすると、次のようになります。
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8080/solr/update/extract?literal.id=doc2..
SimplePostTool: POSTing file test.pdf
SimplePostTool: FATAL: Solr returned an error #500 Internal Server Error
私が使用したコマンドは次のとおりです。
java -Durl=http://localhost:8080/solr/update/extract?literal.id=doc2 -Dtype=application/pdf -jar post.jar test.pdf
私のsolrホームディレクトリはC:\ solrで、これまでに次のことを行いました:
- solr ダウンロード パッケージの example/solr フォルダーの内容をコピーしました
- solr ダウンロード パッケージの contrib/extraction/lib フォルダーを C:\solr\lib にコピーしました
- solr ダウンロード パッケージの dist/apache-solr-cell-3.5.0.jar を C:\solr\dist\apache-solr-cell-3.5.0.jar にコピーしました。
- C:\solr\conf\solrconfig.xml の適切な「lib」タグを
<lib dir="lib" />
およびに変更しました。<lib dir="dist/" regex="apache-solr-cell-\d.*\.jar" />
PDF および HTML ファイルでこれを機能させるには、他に何をする必要がありますか? 複数のチュートリアルと「Getting Started」ガイドを読みましたが、何が問題なのか理解できません。私はTomcatの初心者でもあり、私が知る限り、これはTomcatのログに表示されていません...だから私はほとんど立ち往生しています. 繰り返しますが、XML の例に問題はありません。したがって、Tomcat 自体は正常に動作しており、solr を認識しています (solr 管理ページが表示されます)。どんな助けでも大歓迎です。