python - Stemmer と pos Tagger の優先順位について混乱しています

翻译自：https://stackoverflow.com/questions/27227111 2014-12-01T11:11:33.720

1785 次

そのため、テキストコーパスを分析していて、トークン化されたすべての単語にステマーを使用しました。しかし、コーパス内のすべての名詞も見つけなければならないので、もう一度やりましたnltk.pos_tag(stemmed_sentence) 。

A.] tokenize->stem->pos_tagging

また

B.] tokenize->stem       #stemming and pos_tagging done seperately
    tokeinze->pos_tagging

私は方法Aに従いましたが、pos_taggingを達成する正しい方法について混乱しています。

2 に答える 2