2

Solr 1.4.1を正常にインストールしましたが、Tika 0.4(contrib / extractに含まれています)を正しく動作させることができません。http:// localhost:8080 / solr / ss / update / extractをヒットしようとすると404エラーが発生します(「ss」が私のコアです)。

デプロイ後、すべてのcontrib / extract jarをSolrのWEB-INFディレクトリーに移動しました。また、「dist」ディレクトリーにある「solr-cell」jarも移動しました。

上記で使用した方法はSolr3.3で機能しましたが、PDFの解析がTika 0.8で機能しなくなったため、Solr1.4.1とTika0.4に戻すことにしました。

それが助けになるなら、私はTomcat7.0を使用しています。

4

2 に答える 2

2

問題を解決しました。

マルチコアディレクトリ(example /multicoreでは"core0"と"core1")をコピーし、それらはsolrconfig.xmlの非常に削除されたバージョンを使用していました。デフォルトの例(example / solrにあります)を参照し、「update / extract」の「requestHandler」セクションを取得して、それをsolrconfig.xmlの簡略化されたバージョンに配置し、Tomcat内でSolrWebアプリを再起動しました。解析は完全に機能します。

これが他の誰かに役立つことを願っています。

于 2011-07-22T14:32:39.573 に答える
2

私はSolr5.3.1でdjango_haystackを使用してきましたが、schema.xmlをカスタマイズして同じ問題が発生した場合、Travisの回答に追加したいと思います。

solrconfig.xmlに追加する必要のある行は次のとおりです。

luceneバージョン定義の下

<luceneMatchVersion>5.3.1</luceneMatchVersion>

これらのライブラリインポートを追加します(サンプルファイルから取得しました)。

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/dataimporthandler/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-dataimporthandler-.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-clustering-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-langid-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-velocity-\d.*\.jar" />

次に、すでに定義されているものの近くに追加requestHandlerします/update/extractrequestHandler

<requestHandler name="/update/extract"
  startup="lazy"
  class="solr.extraction.ExtractingRequestHandler" >
  <lst name="defaults">
    <str name="lowernames">true</str>
    <str name="uprefix">ignored_</str>

    <!-- capture link hrefs but ignore div attributes -->
    <str name="captureAttr">true</str>
    <str name="fmap.a">links</str>
    <str name="fmap.div">ignored_</str>
  </lst>
</requestHandler>

それがお役に立てば幸いです。

于 2015-11-24T19:15:01.713 に答える