キーワード/タグのリストを取り、それらを特定の文字列/ファイル/URLに一致させることができるpythonパッケージはありますか?
具体的には、ステミングおよび/またはその他の同義語の一致方法を使用します。
つまり、事前に保存したキーワード:
Ski,
Bike,
Climb
私のテキスト:
Skiing in the mountains is great
でタグ付けする必要がありますSki
Skiing and mountain biking is fun
Ski
Andでタグ付けする必要がありますBike
そして、どこかにマッピングする同義語ファイルがあるBike
場合MTB
MTB is a great way to spend the day
タグ付けするべきBike