そのため、テキストコーパスを分析していて、トークン化されたすべての単語にステマーを使用しました。しかし、コーパス内のすべての名詞も見つけなければならないので、もう一度やりましたnltk.pos_tag(stemmed_sentence)
。
A.] tokenize->stem->pos_tagging
また
B.] tokenize->stem #stemming and pos_tagging done seperately
tokeinze->pos_tagging
私は方法Aに従いましたが、pos_taggingを達成する正しい方法について混乱しています。