アラビア語テキストの検索エンジンを開発するために、Solr で nutch を使用しています。アラビア語のテキストにステマーを実装する必要があります。Solr Stemmer を検索しているときに、これら 2 つのフィルターが提供されていることがわかりました。
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
私はそれらを試しましたが、それらが何をするのか理解できませんでした..だから、誰かが私にいくつかの例を手伝ってくれませんか??
そして、これら2つはこれを行います:
العملات から語幹をとった
ベスタンに語幹
ありがとうございました。