良い一日、私は、ニュースからのフレーズをポジティブまたはネガティブとして分類することを目的として、Pythonで感情分析アプリケーションを作成しようとしています(ナイーブベイズ分類器を使用)。そして、それに適したコーパスを見つけるのに少し苦労しています。「GeneralInquirer」(http://www.wjh.harvard.edu/~inquirer/homecat.htm)を使用してみましたが、問題はありません。これは単語リストであり、フレーズリストではないため、次の文にラベルを付けようとすると、次の問題が発生します。
彼は勝つことを期待されていません。
この文は肯定的であると分類されていますが、これは間違っています。その理由は、「勝つ」はポジティブですが、「勝てない」はフレーズなので「しない」は意味をなさないからです。誰かがその問題のコーパスまたは回避策のいずれかを提案できますか?あなたの助けと洞察は大いに活用されます。