で単語の見出し語化を試みていますNLTK
。
私が今見つけたのは、stem
パッケージを使用して、「車」を「車」に、「女性」を「女性」に変換するなどの結果を得ることができるということですが、「確認」などの接辞を含むいくつかの単語について見出し語化を行うことはできません。
WordNetLemmatizer()
on "acknowledgement"を使用すると "acknowledgement" を返し、 を使用.PorterStemmer()
すると "acknowledge" ではなく "acknowledg" を返します。
単語の接辞を削除する方法を誰か教えてもらえますか?
たとえば、入力が「確認」の場合、出力は「確認」になります。