私はセンチメント データセットを操作してきましたが、bing および nrc データセットには、肯定的な感情と否定的な感情の両方を持ついくつかの単語が含まれていることがわかりました。
** bing – 肯定的感情と否定的感情を含む 3 つの単語 **
env_test_bing_raw <- get_sentiments("bing") %>%
filter(word %in% c("envious", "enviously","enviousness"))
# A tibble: 6 x 2
word sentiment
<chr> <chr>
1 envious positive
2 envious negative
3 enviously positive
4 enviously negative
5 enviousness positive
6 enviousness negative
** nrc – 肯定的および否定的な感情を含む 81 語 **
test_nrc <- as.data.frame(
get_sentiments("nrc") %>%
filter(sentiment %in% c("positive","negative")) %>%
group_by(word) %>%
summarize(count = n()) %>%
filter(count > 1))
env_test_nrc <- get_sentiments("nrc") %>%
filter(sentiment %in% c("positive","negative")) %>%
filter(word %in% test_nrc$word)
# A tibble: 162 x 2
word sentiment
<chr> <chr>
1 abundance negative
2 abundance positive
3 armed negative
4 armed positive
5 balm negative
6 balm positive
7 boast negative
8 boast positive
9 boisterous negative
10 boisterous positive
# ... with 152 more rows
私が何か間違ったことをしたのか、単一のソース データセットで単語がどのようにして否定的感情と肯定的感情の両方を持つことができるのか、興味がありました。これらの状況を処理するための標準的な方法は何ですか?
ありがとうございました!