私は、感情の強さの値を持つ肯定的な言葉と否定的な言葉の感情辞書を持っています。私の主な仕事は、この強度値が最終分類に影響するかどうかを確認することです。これは、「良い」という単語 (強度 = 6) を含むテキストと、優れた (強度 = 9) という単語を含むテキストの最終的な感情スコアが異なるかどうかを確認したいということです。
の特徴ベクトルの作成に混乱していSVM
ます。TF-IDF
メジャーを使用するかPOS tagging
、強度値をチェックしない場合。私の主な問題は、SVMでこの強度値を使用する方法と、単語の強度値を含む特徴ベクトルを生成する方法ですか?
例えば、
"This book is good."
この文の場合、強度値を考慮して特徴ベクトルを生成するにはどうすればよいですか?
最初に、単語の頻度で強度値を乗算し、この加重スコアを機能入力として使用することを考えましたが、単語の頻度が増加するだけです。たとえば、「良い」が 2 回出現し、強度値 6 を乗算すると、その値が 12 になったので、「良い」という単語の出現回数が増えるだけですよね?
SVM
ですから、感情の強さの値を使用できるかどうか、またどのように使用できるか教えてください。それらの値を使用して特徴ベクトルを生成するにはどうすればよいですか?