WordNetを使ってクエリ拡張に関するプロジェクトを作りたいのですが、それを行うためのステップバイステップの方法を見つけるのは難しいです。
この記事に基づいて、次の手順を実行する必要があります(プログラムへの入力として文を想定)。
- トークン化
- 品詞のタグ付け
- ステミングワード
- 語義の曖昧性解消
- 2つのシンセット間の意味的類似性(まだ混乱しています)
...そして、スコアが大きい単語は入力からのクエリ拡張であると結論付けることができます。ただし、これらの各手順を実行する方法については、まだ混乱しています。これらをより詳細にカバーしている情報源はありますか?