私は現在、twitter のセンチメント分析に関する研究を行っています。私はsentiwordnet極性スコアのような定義済みの語彙リソースを組み合わせたいです。そしてそれを機械学習で進めます。問題は、sentiwordnet の正しいスコアを取得することです。以前の作業は常に、単語の意味の負と正の極性の合計スコアによって選択するだけです。たとえば、「mad」という単語は、否定的な単語として 3 回、肯定的な単語として 2 回表示される可能性があります。以前の作業のほとんどは、各極性を自動的に平均化します。そのため、スコアを取得する前に単語のあいまいさを解消して、実際にセンチワードネットを使用できるようにしたいと考えています。対象文とグロス文の類似度を比較して考えていたのですが、比較する方法はありますか?うまくいくと思いますか?そうでない場合は、あなたのアイデアを共有してください..
私はこの分野にまったく慣れておらず、初心者のPythonプログラマーなので、あなたからのアドバイスが本当に必要です..ありがとう..