7

ポジティブ ワードとネガティブ ワードのリストが必要で、単語の強さと週に応じて重みが割り当てられています。私は持っています:

1.) WordNet - すべての単語に + または - のスコアを付けます。

2.) SentiWordNet - [0,1] の範囲で正と負の値を指定します。

これらをいくつかの単語で確認しましたが、

love - wordNet は名詞と動詞の両方に 0.0 を与えています。少なくとも何らかの要因でそれが正であると考える理由がわかりません。

repress
- wordNet は -9.93 を与える - SentiWordNet は - pos と neg の両方で -0.0 を与える。(マイナスになるはずです)

repose - wordNet - 2.488
- SentiWordNet - { pos - 0.125, neg - 0.5 } (正でなければなりません)

どちらを使用するかを決めるには、助けが必要です。

ありがとう。

4

3 に答える 3

3

多くの場合、程度や極性はドメインやコンテキストに依存するため、単語だけでは決定を下すのに十分ではありません。

注釈付きのデータがある場合は、2 つのリソースによって提供されるスコアを特徴として使用して、分類子をトレーニングすることをお勧めします。そうでない場合、1 つのオプションは、問題のドメインに一致する利用可能なセンチメント アノテーション付きコーパスの 1 つを使用することです。データがまったくない場合、タスク全体がいくぶんトリッキーになりますが、感情分類への教師なしアプローチに関するかなりの量の研究があります。たとえば、教師なし感情分析を参照してください。

于 2012-10-15T10:05:03.567 に答える
1

間違っていると思われる場合は、SentiWordNet についてさまざまな意見を述べるためのインターフェイスがあります: http://sentiwordnet.isti.cnr.it/search.php?q=repose

私は最新の Wordnet 3.1 をダウンロードし、ファイル形式のドキュメントを確認しましたが、あなたが言及したセンチメント番号について言及されていません。また、オンライン検索にも表示されません。

したがって、これらの両方の理由から、SentiWordNet を使用することをお勧めします!

(あなたの質問は 1 年前のものだと思います。そのため、何を使用したのか、またその理由を教えていただけないでしょうか?)

于 2013-11-06T03:37:07.110 に答える
0

極性の程度は、単語だけでなく、文や句の文脈にも依存します。同じ単語に関して異なる結果がある場合、それは文脈の違いによるものです。

于 2014-08-30T23:55:36.180 に答える