solr - Solr 3.1 で Tika 0.9 を構成する方法

Question

Solr 3.1 で Tika 0.9 を構成する手順を教えてください。

<requestHandler name="/update/extract" 
                  startup="lazy"
                  class="solr.extraction.ExtractingRequestHandler" >
    <lst name="defaults">
      <!-- All the main content goes into "text"... if you need to return
           the extracted text or do highlighting, use a stored field. -->
      <str name="fmap.content">text</str>
      <str name="lowernames">true</str>
      <str name="uprefix">ignored_</str>

      <!-- capture link hrefs but ignore div attributes -->
      <str name="captureAttr">true</str>
      <str name="fmap.a">links</str>
      <str name="fmap.div">ignored_</str>
    </lst>
  </requestHandler>

これはsolrconfig.xmlで使用して構成します

ありがとう、

score 1 · Accepted Answer

Tika (および依存関係) が solr にインストールされていると仮定すると、必要なことはそれだけです。

ExtractingRequestHandler wiki ページを読みましたか? かなりの量の情報が含まれており、curl を使用してすべてが適切に機能していることをテストできるいくつかのレシピも手軽に提供されています。

solr - Solr 3.1 で Tika 0.9 を構成する方法

1 に答える 1

Related

Reference