Solrをインストールしたばかりで、現在、その使用方法を学ぶために実験を行っています。Solr Cellとlangid機能を使用したいので、リンクされたチュートリアルに従いました。Solr Cellは機能しますが、私は何もすることができません。
でsolrconfig.xml
、私はこれを持っています:
<updateRequestProcessorChain name="langid">
<processor class="org.apache.solr.update.processor.LangDetectLanguageIdentifierUpdateProcessorFactory">
<str name="langid.fl">text,title,subject,description</str>
<str name="langid.langField">language_s</str>
<str name="langid.fallback">en</str>
<bool name="langid.map">true</bool>
</processor>
<processor class="solr.LogUpdateProcessorFactory" />
<processor class="solr.RunUpdateProcessorFactory" />
</updateRequestProcessorChain>
(Tikaでも試してみました)そして、
curl "http://localhost:8983/solr/update/extract?literal.id=test&commit=true" -F "myfile=@test.xml"
しかし、クエリを実行するとtext:[* TO *]
、ドキュメントが返されますが、返さtext_en:[* TO *]
れません。language_s
、私がそれを保存されていると宣言したとしても、頑固に存在しません。*:word
あるのに何も見つからない"words"
ので、ステム処理されません。ログに何も見つかりません。私の最善の推測は、langidが実行されないことであり、その理由はわかりません。
編集:答えを見つけました:続きを読むドキュメント:p
langidは更新要求プロセッサチェーンとして構成されているため、選択する必要があります(自動ではありません)。したがって、これは機能します。
curl "http://localhost:8983/solr/update/extract?literal.id=test&commit=true&update.chain=langid" -F "myfile=@test.xml"