0

私はセンチメント データセットを操作してきましたが、bing および nrc データセットには、肯定的な感情と否定的な感情の両方を持ついくつかの単語が含まれていることがわかりました。

** bing – 肯定的感情と否定的感情を含む 3 つの単語 **

env_test_bing_raw <- get_sentiments("bing") %>%
  filter(word %in% c("envious", "enviously","enviousness"))

# A tibble: 6 x 2
         word sentiment
        <chr>     <chr>
1     envious  positive
2     envious  negative
3   enviously  positive
4   enviously  negative
5 enviousness  positive
6 enviousness  negative

** nrc – 肯定的および否定的な感情を含む 81 語 **

test_nrc <- as.data.frame(
        get_sentiments("nrc") %>%
        filter(sentiment %in% c("positive","negative")) %>%
        group_by(word) %>%
        summarize(count = n()) %>%
        filter(count > 1))

env_test_nrc <- get_sentiments("nrc") %>%
  filter(sentiment %in% c("positive","negative")) %>%
  filter(word %in% test_nrc$word)

# A tibble: 162 x 2
         word sentiment
        <chr>     <chr>
 1  abundance  negative
 2  abundance  positive
 3      armed  negative
 4      armed  positive
 5       balm  negative
 6       balm  positive
 7      boast  negative
 8      boast  positive
 9 boisterous  negative
10 boisterous  positive
# ... with 152 more rows

私が何か間違ったことをしたのか、単一のソース データセットで単語がどのようにして否定的感情と肯定的感情の両方を持つことができるのか、興味がありました。これらの状況を処理するための標準的な方法は何ですか?

ありがとうございました!

4

1 に答える 1