5

良い一日、私は、ニュースからのフレーズをポジティブまたはネガティブとして分類することを目的として、Pythonで感情分析アプリケーションを作成しようとしています(ナイーブベイズ分類器を使用)。そして、それに適したコーパスを見つけるのに少し苦労しています。「GeneralInquirer」(http://www.wjh.harvard.edu/~inquirer/homecat.htm)を使用してみましたが、問題はありません。これは単語リストであり、フレーズリストではないため、次の文にラベルを付けようとすると、次の問題が発生します。

彼は勝つことを期待されていません。

この文は肯定的であると分類されていますが、これは間違っています。その理由は、「勝つ」はポジティブですが、「勝てない」はフレーズなので「しない」は意味をなさないからです。誰かがその問題のコーパスまたは回避策のいずれかを提案できますか?あなたの助けと洞察は大いに活用されます。

4

2 に答える 2

4

たとえば、Councill、McDonald、Velikovichによる「何が素晴らしいか、何がそうでないか:感情分析を改善するために否定の範囲を分類することを学ぶ」を参照してください。

http://dl.acm.org/citation.cfm?id=1858959.1858969

とフォローアップ、

http://scholar.google.com/scholar?cites=3029019835762139237&as_sdt=5,33&sciodt=0,33&hl=en

例:Morante et al 2011

http://eprints.pascal-network.org/archive/00007634/

于 2012-05-29T10:44:35.953 に答える
3

この場合、作品は勝つと期待されるフレーズの意味を変更せ、それを逆転させます。これを識別するには、文に品詞タグを付け、否定として(私が思うに)動詞句に否定副詞を適用する必要があります。ただし、このタイプの修飾子ではないことを示すコーパスがあるかどうかはわかりません。

于 2012-05-28T20:24:58.170 に答える