こんにちは、Python ステマーで単語をステミングしようとしています。Porter と Lancaster を試しましたが、同じ問題があります。彼らは、「er」または「e」で終わる正確な単語をステミングできません。
たとえば、それらはステム
computer --> comput
rotate --> rotat
これはコードの一部です
line=line.lower()
line=re.sub(r'[^a-z0-9 ]',' ',line)
line=line.split()
line=[x for x in line if x not in stops]
line=[ porter.stem(word, 0, len(word)-1) for word in line]
# or 'line=[ st.stem(word) for word in line]'
return line
この問題を解決するアイデアはありますか?