次のチュートリアル http://wiki.apache.org/solr/ExtractingRequestHandlerを使用して、solr で PDF ファイルのインデックスを作成しようとしています が、コマンドを実行するたびに
java -jar post.jar *.pdf
org.apache.solr.common.SolrException: Invalid UTF-8 middle byte 0xe3 Error PDF を solr サーバーにインデックス付けするのを手伝ってください。tika 以外に役立つ統合はありますか。