3

WordNetを使ってクエリ拡張に関するプロジェクトを作りたいのですが、それを行うためのステップバイステップの方法を見つけるのは難しいです。

この記事に基づいて、次の手順を実行する必要があります(プログラムへの入力として文を想定)。

  1. トークン化
  2. 品詞のタグ付け
  3. ステミングワード
  4. 語義の曖昧性解消
  5. 2つのシンセット間の意味的類似性(まだ混乱しています)

...そして、スコアが大きい単語は入力からのクエリ拡張であると結論付けることができます。ただし、これらの各手順を実行する方法については、まだ混乱しています。これらをより詳細にカバーしている情報源はありますか?

4

1 に答える 1

2

クエリ拡張は、IR (情報検索) の下でそれ自体が巨大な分野です。

また、WordNet はそれ自体が巨大であるため、1 ステップごとの指示を見つけるのは困難です。ただし、非常に優れたリソースがたくさんあります。いくつかの Web の例を取り上げて自分で試してみることから始めました。

始めるのに役立つリソース。

  1. wordnetサイト自体 (例を含む)
  2. WordNetウィキペディアのページ
  3. Python Programming.net にはWordNet チュートリアル ページがあります。
  4. Python を知らなくても、O'Reilly の本「Natural Language Processing with Python」を強くお勧めします。そのウェブサイトには、始めるための例がたくさんあります。

それがあなたの助けになることを願っています。

于 2012-11-13T23:00:14.543 に答える