2

私は機械学習プロジェクトに取り組んでおり、進歩の最初の段階にあります。私は特徴を抽出し、その特徴を使用するか使用しないかをテストしています。2つのクラスで構成されるデータセットがあります。感情とそのグループのいずれかとの間に関係が生じているかどうかを確認したいと思います。私のデータは次のようになります。

group_a this is a tweet
group_b this is another tweet
group_b this is another tweet
group_a this is another tweet

感情とグループの相関関係を見つけるにはどうすればよいですか?これは私のプロジェクトの特徴選択部分であるため、手動で実装する代わりに、任意のツールを使用できます。WEKA、PRTools、その他、その方法を教えていただければ大歓迎です。

PS:実際、アルゴリズムを実装する前に、次のようなものが得られるかどうかを確認したいと思います。

つまり、group_aはgroup_bよりも負です

したがって、テストデータで文を取得すると、それが否定的な感情の文である場合、group_aに関連している可能性があると言えます。

4

2 に答える 2

0

あなたの質問から、肯定的な感情と否定的な感情へのバイナリ感情分類を試みていると思います。Weka で C4.5 決定木分類器を使用することをお勧めします。C4.5モデルで採用されているエントロピー測定が達成しようとしている方法の理論的な詳細に進みたい場合は、Chをご覧ください。マーク・ホールの論文の4

于 2013-01-08T18:05:23.143 に答える
0

NLTK でセンチメント分析を実行する方法に関する 1 つの優れたドキュメントを次に示します。

http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/

また、scikit-learn は、Python プログラミング言語用のオープン ソースの機械学習ライブラリです。あまりにも 2 つのクラスにしか分類していないため、Bernoulli Naive Bayes 分類器はタスクを効率的に解決できるはずです。

http://scikit-learn.org/stable/modules/naive_bayes.html#bernoulli-naive-bayes

あなたの解決策= nltk + scikit

乾杯。

于 2014-05-11T09:20:46.643 に答える