2

ポーター ステミング アルゴリズムを実装しようとしていますが、この時点で行き詰っています。

ステップ 1b

(m>0) EED -> EE                    feed      ->  feed
                                   agreed    ->  agree
(*v*) ED  ->                       plastered ->  plaster
                                   bled      ->  bled
(*v*) ING ->                       motoring  ->  motor
                                   sing      ->  sing

feed の m は 1 じゃないの?フィード >> [c]vvc[] >>[c]vc[].

もしそうなら、なぜ彼はフィードを料金に変換しなかったのですか?私はそれが間違っていることを知っています。

ここで元のアルゴリズムを確認できますhttp://tartarus.org/~martin/PorterStemmer/def.txt

ありがとう

4

1 に答える 1

1

'feed' の m は確かに 1 ですが、ドキュメントを注意深く読み直す必要があります。状態の m はステムの寸法を表しており、交換後に計算する必要があります。が有効かどうかを確認する場合feed -> fee、m(fee) = 0 を計算するため、置換は行いません。

アルゴリズムもありがとう!興味深かった!

于 2010-12-23T21:53:34.563 に答える