0

LangDetectLanguageIdentifierUpdateProcessorFactoryドキュメントのインデックス作成時に言語を検出するために、SOLR に付属するものを使用しようとしています。それはかなり簡単な実装に見えます。私はsolrconfig.xmlに以下を入れました

<updateRequestProcessorChain>
  <processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory">
    <str name="langid.fl">title</str>
    <str name="langid.langField">language_s</str>
    <str name="langid.fallback">en</str>
    <bool name="langid.map">true</bool>
    <bool name="langid.map.individual">true</bool>
    <str name="langid.map.individual.fl">title</str>
    <str name="langid.whitelist">en, fr, de, it, ar, ja, zh-cn, zh-tw</str>
    <bool name="langid.map.keepOrig">true</bool>
    </processor>
    <processor class="solr.LogUpdateProcessorFactory" />
    <processor class="solr.RunUpdateProcessorFactory" />
 </updateRequestProcessorChain> 

しかし、solrを起動すると、クラスをロードできないと表示されますLangDetectLanguageIdentifierUpdateProcessorFactory。私も試してみTikaLanguageIdentifierUpdateProcessorFactoryましたが、運がありませんでした。私はおそらく何かが欠けています。SOLR で多言語検出機能を使用するには、追加のパッケージ/ライブラリ/クラスが必要ですか?

4

1 に答える 1

1

apache-solr-langid-X.X.jarおよび依存する jar がcontrib/langid/libsolr で使用できることを確認してください。

于 2013-05-29T11:07:56.797 に答える