実行した後nltk.stem.porter.PorterStemmer().stem_word(word)
、「ing」が切り取られているか、「y」が「i」と交換された多くの単語が表示されます。たとえば、「品質」は「品質」になり、(さらに奇妙な)「値」は「値」になりますか?
結果の単語は実際の英語の単語ではないので、どのように使用するのかわかりません。私の最善の推測は、語幹の単語を別の関数に入れて、この語幹から派生した/子の単語をすべて取得することです(たとえば、「valu」が返さ['valuing','valued', 'values', ...]
れます。そのような関数はありますか?