2

ラテン語 (スクリプトの種類ではなく言語) のテキストを分析するための Solr/Lucene フィルターはありますか? これらは他の多くの言語 (イタリア語、チェコ語など) 用に存在しますが、ラテン語はデフォルトで Solr ディストリビューションに含まれていません。

もちろん、これは理にかなっています (ラテン語を話す人はもう誰もいません...) が、見つけたいと思っています。おそらく、私が見ることができるプラグインのリストがどこかにあるでしょう。すべての結果がラテン語のエンコード ブロックのみであるため、検索するのは困難です。

4

2 に答える 2

0

ラテン語のステミングとラテン語の数値変換を行う外部プロジェクトがあります。

于 2014-08-20T08:53:31.583 に答える
0

デフォルトのストップ ワード セットは特に有用ではありませんが、ステミング機能が必要でない限りStandardAnalyzer、少なくとも妥当な出発点となるはずです。

ステマーを探しているなら、そこにLatinStemFilterもあります。LUCENE-4229で見つけることができます。ただ、現時点では効果のほどはよくわかりません。

于 2013-10-09T15:37:45.760 に答える