Textmining with R Web テキストからプロットを作成したいのですが、私のデータを使用します。基本的には、年間上位の用語を検索してグラフ化します (図 5.4: http://tidytextmining.com/dtm.html )。私のデータは、最初のデータよりも少しきれいですが、R は初めてです。私のデータには、2016-01-01 形式の「日付」列があります (これは日付クラスです)。私は2016年のデータしか持っていないので、同じことをしたいのですが、より詳細に(月別または日別)
library(tidyr)
year_term_counts <- inaug_td %>%
extract(document, "year", "(\\d+)", convert = TRUE) %>%
complete(year, term, fill = list(count = 0)) %>%
group_by(year) %>%
mutate(year_total = sum(count))
year_term_counts %>%
filter(term %in% c("god", "america", "foreign", "union", "constitution",
"freedom")) %>%
ggplot(aes(year, count / year_total)) +
geom_point() +
geom_smooth() +
facet_wrap(~ term, scales = "free_y") +
scale_y_continuous(labels = scales::percent_format()) +
ylab("% frequency of word in inaugural address")
アイデアは、テキストから特定の単語を選択し、それらが数か月にわたってどのように変化するかを確認することです.
ありがとうございました!