私は機械学習プロジェクトに取り組んでおり、進歩の最初の段階にあります。私は特徴を抽出し、その特徴を使用するか使用しないかをテストしています。2つのクラスで構成されるデータセットがあります。感情とそのグループのいずれかとの間に関係が生じているかどうかを確認したいと思います。私のデータは次のようになります。
group_a this is a tweet
group_b this is another tweet
group_b this is another tweet
group_a this is another tweet
感情とグループの相関関係を見つけるにはどうすればよいですか?これは私のプロジェクトの特徴選択部分であるため、手動で実装する代わりに、任意のツールを使用できます。WEKA、PRTools、その他、その方法を教えていただければ大歓迎です。
PS:実際、アルゴリズムを実装する前に、次のようなものが得られるかどうかを確認したいと思います。
つまり、group_aはgroup_bよりも負です
したがって、テストデータで文を取得すると、それが否定的な感情の文である場合、group_aに関連している可能性があると言えます。