私は vader からこれを取得できることを知っています: {'neg': 0.071, 'neu': 0.895, 'pos': 0.034, 'compound': -0.296}
しかし、それらは全体的な結果だけを得る方法ですか? たとえば、{'Positive'} または {'Negative'} と言います。
また... ベイダーでできることをすべて確認するには、何を参照すればよいですか? 関数のリストか何かのように。
複合スコアは、レキシコン内の各単語の価スコアを合計して計算され、ルールに従って調整され、-1 (最も極端な負) と +1 (最も極端な正) の間になるように正規化されます。これは、特定の文に対するセンチメントの 1 つの 1 次元測定値が必要な場合に最も役立つメトリックです。
次に、ネガティブ [-1, 0)、ニュートラル [0, 0.5)、ポジティブ [0.5, 1] のしきい値を設定して、それらをカテゴリに分類できます。例えば:
def get_category(compounded):
if compounded < 0:
return 'negative'
elif compounded < 0.5:
return 'neutral'
else:
return 'positive'
データとユースケースに最適なしきい値を選択してください。