0

アラビア語テキストの検索エンジンを開発するために、Solr で nutch を使用しています。アラビア語のテキストにステマーを実装する必要があります。Solr Stemmer を検索しているときに、これら 2 つのフィルターが提供されていることがわかりました。

<filter class="solr.ArabicNormalizationFilterFactory"/>

<filter class="solr.ArabicStemFilterFactory"/>

私はそれらを試しましたが、それらが何をするのか理解できませんでした..だから、誰かが私にいくつかの例を手伝ってくれませんか??

そして、これら2つはこれを行います:

العملات から語幹をとった

ベスタンに語幹

ありがとうございました。

4

1 に答える 1

1

詳細については、http: //lucene.apache.org/core/3_6_0/api/contrib-analyzers/org/apache/lucene/analysis/ar/ArabicStemmer.htmlをご覧ください。

それは言う:

ステミングは次のように定義されます。

  • 添付された定冠詞、接続詞、前置詞の削除。
  • 一般的な接尾辞のステミング。
于 2012-05-22T00:00:43.470 に答える