私は感情分析をいじっていて、シードデータを探しています。無料の辞書はありますか?
それは本当に簡単です: 「ポジティブ」、「ネガティブ」、「ニュートラル」の 3 つのテキスト/センテンス。巨大である必要はありません。
最終的には、特定のユース ケース用に独自のシード データを生成することになると思いますが、構築中に何かを試すことができれば素晴らしいと思います。
私は感情分析をいじっていて、シードデータを探しています。無料の辞書はありますか?
それは本当に簡単です: 「ポジティブ」、「ネガティブ」、「ニュートラル」の 3 つのテキスト/センテンス。巨大である必要はありません。
最終的には、特定のユース ケース用に独自のシード データを生成することになると思いますが、構築中に何かを試すことができれば素晴らしいと思います。
UIC のBing Liu と Minqing Huには、多数のデータセットがあります。
コーネル大学のボー・パン氏には、さらにいくつかあります。
感情辞書に興味がある場合は、多くの著者が、手動で作成したリストに基づいた作業や、独断的な用語のリストを取得するためのその他の半自動化された方法を提示しています。良いアプローチの 1 つは、同義語などの関係を使用してポジティブ/ネガティブ ワードのコアを拡張することにより、 WordNetデータベースから派生させることです。
手動で作成されたリストの良い例は、General Inquirerです。
リストを導出する半自動化された方法については、Esuli と Sebastiani の SentiWordNetを調べてください。
これらは一般に研究目的で利用できると思いますが、研究以外の目的でこれらのリソースを使用する場合は、著者に連絡する必要があるかもしれません.
B.
感情分析用のコーパスと単語リストのリストを維持しています (私の AFINN はその 1 つです)。
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Corpora
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Affective_word_lists