可能な時間と可能なアイテムのベクトルがある場合:
possible.items = c(12,13,14,15,16)
possible.hours = 0:23
そして、それらを購入した時間にそれらのアイテムを購入した顧客に関するいくつかのデータ:
frame = data.frame(id=101:105, hour=c(0,0,0,1,1), item=c(12,14,12,12,15))
可能な時間ごとに行があり、アイテムの組み合わせにデータセットの関連する行数が入力されたサマリーデータフレームを作成するにはどうすればよいですか?
サマリーデータフレームを作成する方法は知っていますが、元のデータセット「フレーム」にない行を含むフレームはありません。
summary = aggregate(id~hour+item, data=frame, FUN=length)
また、考えられるすべての組み合わせを取得する方法もあります。
poss = merge(data.frame(hour=possible.hours), data.frame(item=possible.items), all=TRUE)
2つを組み合わせる方法がわかりません。また、私が下る道が正しいかどうかもわかりません。
次のようなデータフレームを取得したいと思います。
hour item count
0 12 2
0 13 0
0 14 1
0 15 0
0 16 0
1 12 1
...
23 16 0