-3

R は初めてですが、データセットを分析してみます 元のリンクは次のとおりですhttps://cache-default03g.cdn.yandex.net/download.yandex.ru/company/jobs/test_data_dreams.txt

私のコードは(R Studio 0.99.903とR 3.3.1を使用しています)

# get the data from url url <- "https://cache- default03g.cdn.yandex.net/download.yandex.ru/company/jobs/test_data_dreams.txt" testdata <-read.table(url, header = T, sep="\t") #install packages for text mining to analyze the queries install.packages("slam") install.packages("tm") library(tm) #convert unix to GMT testdata$timestamp..unix. <- as.POSIXct(as.numeric(as.character(testdata$timestamp..unix.)),origin="1970-01-01",tz="GMT") #delete some words testdata$query <- gsub("к чему снится ", "\\1", testdata$query) testdata$query <- gsub("к чему сниться ", "\\1", testdata$query) testdata$query <- gsub(" к чему снится", "\\1", testdata$query) testdata$query <- gsub(" к чему сниться", "\\1", testdata$query) testdata$query <- gsub("снится ", "\\1", testdata$query) testdata$query <- gsub(" к чему", "\\1", testdata$query)'

今、私のデータフレームはこのように見えます。

> head(testdata) timestamp..unix. query city 1 2016-02-04 10:15:13 волна вынесла на берег Москва 2 2016-02-24 10:28:53 бегать наперегонки Екатеринбург 3 2016-02-07 15:31:51 свадьба мужчине со своей женой Владикавказ 4 2016-02-05 08:06:24 иголка медицинская Тамбов 5 2016-02-16 15:21:16 давняя знакомая Калининград 6 2016-02-27 03:38:46 белый маленький котенок Новосибирск

今、私はクエリをプロットして、日中(月中も)の一般的な分布と、私が持っている各都市の分布を確認しようとしています。

日と時間を別々に読み取り、クエリ自体ではなくクエリの分布だけをプロットするために選択する必要があるツールを教えてください。

ありがとう!

4

1 に答える 1

0

lubridateパッケージを使用できます。日付から日と時間を抽出してテストするのは非常に簡単です。例えば ​​:

 # Add a column for day
df$day <- day(df$timestampcol)

# Add a column for the hour
df$hour <- hour(df$timestampcol)

プロットについては、ggplot2パッケージをお勧めします。ここでは、時系列をプロットする例を示します。

于 2016-08-23T16:08:19.763 に答える