私は現在、ドキュメント全体を実行し、すべてのキーワードを取り出して、これらのキーワードを他のドキュメントで見つかったものと照合しようとするスクリプトに取り組んでいます。これを複雑にするいくつかの詳細がありますが、それらは私の質問にはあまり関係ありません. 基本的には時制に関係なく単語を一致させたいと思っています。
例: 文字列 "swim"、"swam"、および "swimming" が与えられた場合、これらがすべて同じ単語であることを認識できるプログラムが必要です。私にはそれほど問題ではありません。
この問題は、これらすべての単語形式を含む辞書でほとんど解決できることは承知していますが、これに役立つような方法でマップされた辞書を知りません。Python と互換性のあるソリューションまたはライブラリを好むのは、それが現在このスクリプト作成に使用しているためです。と連携)