私の要件は、ニュース記事を取り込み、それらが主題について肯定的か否定的かを判断することです。私は以下に概説するアプローチを取っていますが、NLPがここで役立つかもしれないと読み続けています. 私が読んだすべては、NLP が事実から意見を検出することを示していますが、これは私の場合にはあまり重要ではないと思います。私は2つのことを疑問に思っています:
1) アルゴリズムが機能しないのはなぜですか?また、どうすれば改善できますか? (皮肉はおそらく落とし穴であることは知っていますが、私たちが得るニュースの種類でそれがあまり発生しているとは思いません)
2) NLP はどのように役立ちますか? なぜ使用する必要があるのですか?
私のアルゴリズム的アプローチ (肯定語、否定語、否定語の辞書があります):
1) 記事内の肯定語と否定語の数を数える
2) 肯定語または否定語の 2 語または 3 語で否定語が見つかった場合 (つまり、最高ではない)、スコアを否定します。
3) スコアに、各単語に手動で割り当てられた重みを掛けます。(1.0 から開始)
4) ポジティブとネガティブの合計を合計して、センチメント スコアを取得します。