7

私が取り組んでいるプロジェクトには、優れたステミング アルゴリズムが必要です。Porter Stemmer を見るように勧められました。Porter ステマーのページを調べたところ、"Snowball" ステマーが優先され、現在は廃止されていることがわかりました。

優れたステマーが必要ですが、独自のステマーの実装 (または最適化) にかなりの時間を費やすことはできません。自由に入手できる「すぐに使える」最高のステマーは何ですか? リーズナブルな価格で利用できる無料ではないステマーはありますか? それとも、Snowball ステマーが最善の策でしょうか?

4

2 に答える 2

8

Porter2ステマーは、私が使用することに決めたものです。ポーターステマーが標準のようでしたが、著者のページを見つけたところ、「Snowball (Porter2)」ステマーを勧められていました。このページには C ポートのリンクがあります。

于 2008-12-28T23:10:17.763 に答える
2

それは実際にどのように適用するかによって異なります。Natural Language Toolkit ( http://nltk.sourceforge.net ) には、ほとんどのアプリケーションを処理できる多数のステマーが実装されています。私は Morphy ステマーの方が好きです。

もちろん、Python で利用できるので、別の言語で作業している場合は、いつでもコードを調べてアルゴリズムを収集し、選択した言語に転送できます。Python は非常に読みやすいです。

于 2008-10-22T17:17:41.783 に答える