私はこのようなデータフレームを持っています
Tag Date (DD/MM/YYYY)
AA 1/1/2010
AB 2/1/2010
AC 3/1/2010
AA 4/1/2010
AB 5/1/2010
AA 6/1/2010
AB 7/1/2010
AC 8/1/2010
現在、異なるタグの数は限られています (平均で 10 未満)。私が必要としているのは、より快適な方法でデータを取得することです。タグ シーケンス データを分析して、より頻繁に繰り返されるパターンを見つけました。この場合は (AA、AB、AC) になります。
今、私が望むのは、データをこのように変換して、それを操作できるようにすることです。
AA AB AC
1/1/2010 2/1/2010 3/1/2010
4/1/2010 5/1/2010 NA
6/1/2010 7/1/2010 8/1/2010
Turning field values into column names in an R data frame というこの質問を見たことがありますが、これは私が必要としているものに非常に近いものです。これを行う
>libray(reshape2)
>df<-sqldf("SELECT Tag, Date FROM validData")
>head(dcast(df,Date~Tag))
収量
Using Date as value column: use value_var to override.
Aggregation function missing: defaulting to length
Date AF687A AVISOO B32D76 B3DC39 B52C72 DF7EAD DF8E83 DFA521 DFA91A
1 2010-12-23 09:18:50 0 0 0 0 1 0 0 0 0
2 2010-12-23 09:18:52 1 0 0 0 0 0 0 0 0
3 2010-12-23 09:18:54 0 0 0 0 1 0 0 0 0
4 2010-12-23 09:18:57 1 0 0 0 0 0 0 0 0
5 2010-12-23 09:18:58 0 0 0 0 1 0 0 0 0
6 2010-12-23 09:19:00 0 0 0 1 0 0 0 0 0
私は近いと思いますが、上で説明したテーブルの圧縮のように、最後のステップを理解できません。手がかりはありますか?