solr - Solr で ICUTokenizerFactory を使用できない

Question

Solr スキーマで ICUTokenizerFactory を使用しようとしています。これが私がとを定義fieldした方法fieldTypeです。

<fieldType name="text_icu" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
        <tokenizer class="solr.ICUTokenizerFactory"/>
    </analyzer>
</fieldType>

<field name="fld_icu" type="text_icu" indexed="true" stored="true"/>

そして、Solrを起動すると、このエラーが発生します

Plugin init failure for [schema.xml] fieldType "text_icu": Plugin init failure for [schema.xml] analyzer/tokenizer: Error loading class 'solr.ICUTokenizerFactory'

私はそれを検索しましたが、成功しませんでした。何かが足りないのか、スキーマに問題があるのかわかりません。誰かが ICUTokenizerFactory を試したことがあれば、何が問題なのか教えてください。

score 11 · Accepted Answer

これを solrconfig.xml の先頭に追加します。

<config>
  <lib dir="${user.dir}/../contrib/analysis-extras/lucene-libs/" />
  <lib dir="${user.dir}/../contrib/analysis-extras/lib/" />

これは、solr.solr.home がインスタンスに設定されたサンプルディレクトリから実行していることを前提としています。それ以外の場合は、Solr インストールへの絶対パスを使用してください。

これらすべての jar を lib ディレクトリ (solr ホームではなくコアの下) にコピーすることもできます。しかし、上記はより簡単な方法です。

score 8 · Accepted Answer

ウィキから：

Lucene は、analysis-extras contrib モジュールの solr.ICUTokenizerFactory を使用して、これらの言語を音節に分割するためのサポートを提供します。このトークナイザーを使用するには、solr/contrib/analysis-extras/README.txt を参照して、SOLR_HOME/lib に追加する必要がある jar の手順を確認してください。

solr - Solr で ICUTokenizerFactory を使用できない

2 に答える 2

Related

Reference