3

これは本当に2つの質問だと思います。data.table パッケージを使用して大規模なデータセットを要約しようとしています。元の大きなデータセットが df1 で、残念ながら df1 には 50 列 (y0... y49) があり、3 つのフィールド (segmentfield1、segmentfield2、segmentfield3) の合計が必要だとします。すべての y0...y49 列を入力するよりも簡単な方法はありますか? これに関連して、各合計で入力する代わりに、data.table に一般的な na.rm=T がありますか?

dt1 <- data.table(df1)
setkey(dt1, segmentfield1, segmentfield2, segmentfield3)
dt2 <- dt1[,list( y0=sum(y0,na.rm=T), y1=sum(y1,na.rm=T), y2=sum(y2,na.rm=T), ... 
            y49=sum(y49,na.rm=T) ),
            by=list(segmentfield1, segmentfield2, segmentfield3)]
4

1 に答える 1