基本的な感情分析を行うための最も簡単で簡単な方法は、ベイズ分類器を使用することであるように思われます(私がここSOで見つけたものによって確認されました)。反論やその他の提案はありますか?
3 に答える
単語表現のバッグを備えたベイズ分類器は、最も単純な統計手法です。より複雑になる代わりに、より高度な分類器と機能表現に移行することで、大幅に優れた結果を得ることができます。
統計的手法だけが町のゲームではありません。テキストの構造をよりよく理解しているルールベースの方法は、他の主なオプションです。私が見たところ、これらは実際には統計的手法ほどうまく機能していません。
マニングとシュッツェの統計的自然言語処理の基礎第16章、テキスト分類をお勧めします。
感情分析を行うためのより単純で単純な方法は考えられませんが、ナイーブ ベイズの代わりにサポート ベクター マシンを使用することを検討してください (一部の機械学習ツールキットでは、これはドロップインの代替品になる可能性があります)。Bo Pang、Lillian Lee、および Shivakumar Vaithyanathan による「Thumbs up? Sentiment Classification using Machine Learning Techniques」をご覧ください。これは、これらの手法に関する初期の論文の 1 つであり、関連する一連の手法の精度結果の優れた表を示しています。 、どれも (クライアントの観点から) 他のものよりも複雑ではありません。
上記のケンによって提供された回答に基づいて、別の論文があります
「多様な情報源を持つサポート ベクター マシンを使用した感情分析」トニーとニジェール、
これは、Pang と Lee が使用する単語の袋よりも多くの機能を割り当てることを検討しています。ここでは、SVM の追加機能として、wordnet を活用して、形容詞の意味的差異と、テキスト内のトピックに対する感情の近さを判断します。感情に基づいてテキストを分類する以前の試みよりも優れた結果を示しています。