意見マイニング/感情分析は、自然言語処理のやや最近のサブタスクです。テキスト分類と比較するものもあれば、より深いスタンスをとるものもあります。感情分析(意見マイニング)で最も難しい問題についてどう思いますか?いくつか挙げていただけますか?
4 に答える
感情分析の主な課題は次のとおりです。-
1)固有表現抽出-実際に話しているのは何ですか。たとえば、300人のスパルタはギリシャ人のグループまたは映画ですか。
2)照応解決-代名詞または名詞句が指すものを解決する問題。「私たちは映画を見て夕食に行きました。それはひどいものでした。」「それ」とは何ですか?
3)構文解析-動詞や形容詞が実際に参照している文の主語と目的語は何ですか?
4)皮肉-作者がわからない場合、「悪い」が悪いか良いかがわかりません。
5)Twitter-略語、大文字の欠如、スペルの誤り、句読点の誤り、文法の誤り、..。
私は、これらが感情分析の精度が向上する可能性がある領域であるというHightechriderに同意します。また、感情分析は、ほとんどの場合、クローズドドメインテキストで行われる傾向があることも付け加えておきます。オープンドメインテキストでそれを行おうとすると、通常、非常に悪い精度/ F1メジャー/あなたが持っているもの、または特定の文法構造のみを見るため、疑似オープンドメインになります。したがって、コンテキストを識別し、それに基づいて意思決定を行うことができるトピックに敏感な感情分析は、研究(および業界製品)にとってエキサイティングな領域です。
また、彼の5番目のポイントをTwitterから他のソーシャルメディアサイト(Facebook、Youtubeなど)に拡張します。ここでは、短く、文法的でない発話が一般的です。
答えは、言語の複雑さ、文法の間違い、そしてスペルだと思います。人々がそこで意見を表明する方法はたくさんあります。たとえば、皮肉は非常に前向きな感情として誤って解釈される可能性があります。
感情分析にはいくつかのタイプ(ドキュメントレベル、文レベル、比較感情分析など)があり、それぞれに特定の問題があるため、質問は一般的すぎる可能性があります。
一般的に言って、私は@Ian Mercerの回答に同意し、他に3つの問題を追加します。
- より詳細な感情/感情を検出する方法。ポジティブとネガティブは非常に単純な分析です。課題の1つは、意見の中にどれだけの憎しみがあるか、どれだけの幸福、どれだけの悲しみなどの感情を抽出するかです。
- 意見が肯定的であるオブジェクトと意見が否定的であるオブジェクトを検出する方法。たとえば、「彼女は彼に勝った!」と言う場合、これは彼女に対するポジティブな感情と彼に対するネガティブな感情を同時に意味します。
- 非常に主観的な文や段落を分析する方法。人間にとってさえ、この高い主観的なテキストの感情に同意するのは非常に難しい場合があります。コンピューターを想像してみてください...