現在、英語のみで動作するsolrのビルドがあり、アラビア語のサポートを追加する必要があります。SolrWikiには、開始方法に関する詳細があまりありません。
これらは、IVEが行った次の手順です
schema.xmlに以下を追加しました
<fieldType name="text_general_arabic" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
</analyzer>
</fieldType>
Schema.xmlでフィールドを定義しました
<field name="البرتغالية" type="text_general_arabic" indexed="true" stored="true"/>
参考までに、ブラウザでgoogletranslateからアラビア語のテキストをコピーして貼り付けました
後で、メモ帳をユニコードファイルとして使用してcsvファイルを作成し、Arabic.csvとして保存しました。このファイルのフィールド名は、
ポルトガル語
次のcURLコマンドを使用してファイルにインデックスを付けようとすると
D:\>curl http://localhost:8080/solr/coll9/update/csv -F "stream.file=D:\Arabic.csv" -F "commit=true" -F "optimize=true"
-F "encapsulate="" -F "keepEmpty=true"
未定義のフィールドエラーが発生しますどこが間違っているのかわかりません
更新:csvファイルの代わりにXMLファイルで同じことを試してみると、それは機能しています