Lucene 2.2を変更してアラビア語アナライザーを追加することは可能ですか?誰かがすでにこれを行っている場合は、どこでsource/jarを入手できますか
3 に答える
Lucene3.0.1にはArabicAnalyzerがあります。これはcontribパッケージに含まれています。
Lucene 3.0.1にアップグレードして、これをすぐに使用できるようにすることができます。このリリースではTokenStreamAPIが変更されているため、Lucene2.2の場合と同じようにこれを使用することはおそらくできません。ただし、最新のLuceneリリースに移行したくない場合は、2.2への変更をバックポートすることはそれほど難しくありません。
誰かが、lucene2.4でアラビア語とペルシア語のサポートを取得する方法を前に私に尋ねました
したがって、これらは非公式にここにバックポートされました:http: //people.apache.org/~rmuir/
http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir /arabicFarsiLucene241_core.patch
これは、2.4.1にアップグレードするだけでよいことを意味します。これは、2.9または3.0にアップグレードするよりも簡単な場合があります。
お役に立てれば
または、アナライザーにlucene-hunspellを使用してみることができます。これは現在Luceneトランクで機能しています-Lucene3.0.1で機能するかどうかはわかりません。これがRobertMuirの説明とアラビア語を含む辞書のリストです。これをバックポートすることもできると思います。Shashikantの提案は実装が簡単なようですが、これはより良い品質かもしれません。