私は潜在的な問題で立ち往生しています、そしてあなたが私を助けてくれることを願っています:)
たとえば、複数の店舗を表示する次のデータテーブルがあり、訪問者が店舗に入るたびに、日時が記録されます。これは、すべての行/行が1つのストアに入った1人の訪問者であることを意味します。
data <- structure(list(store.ID = c("1", "1", "1", "1", "1",
"2", "2", "2", "2", "2", "3", "3", "3",
"3", "3", "4", "4", "4", "4", "4"), Time = structure(c(6L,
7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 1L, 2L, 3L, 4L, 5L,
16L, 17L, 18L, 19L, 20L), .Label = c(" 12:09:19", " 12:09:25",
" 13:09:30", " 13:09:35", " 14:09:40", " 12:00:03", " 12:00:09",
" 12:00:14", " 14:00:25", " 16:00:32", " 12:27:19", " 13:27:25",
" 14:27:41", " 14:27:46", " 17:27:59", " 12:46:10", " 12:46:19", " 13:46:29",
" 14:46:39", " 15:46:50"), class = "factor"), Date = structure(c(1351728000,
1351728000, 1351728000, 1351728000, 1351728000, 1351814400, 1351814400,
1351814400, 1351814400, 1351814400, 1351814400, 1351814400, 1351814400,
1351814400, 1351814400, 1351814400, 1351814400, 1351814400, 1351814400,
1351814400), class = c("POSIXct", "POSIXt"), tzone = "UTC")), .Names = c("storeID", "Time", "Date"), class = "data.frame", row.names = c(NA,
-20L))
[編集]店舗は24時間年中無休です。今、私は、各訪問/行を1日の24時間の期間の1つに割り当てるソリューション/方法を用意したいと思います(つまり、09.00-10.00は1、10.00-11.00は2など)。次に、2日間連続して1時間あたりの訪問者数を取得したいと思います。storeIDやCity(この例には示されていません)などの特定の固定要素について、これを分離できるようにしたいと思います。また、来店者がいない場合は、この時間間隔内に来店者がいないことをデータファイルに示してください。この場合は0を返します。 [編集]
私のデータファイルは巨大で、70万行を超えていることに注意してください。
問題を明確にしたいと思います。
MvZB