38

data.frameがdfあり、この中のすべての行dfが複製され、の各行に対してlengthTime1からカウントされる新しい列が追加されるようにしたいと思います。lengthTimedf

かなり複雑に聞こえますが、基本的にはに適用expand.gridする必要がありますdf。これは醜い回避策であり、私は最も簡単な解決策があると感じています(おそらくbase-R関数でさえ?):

df <- data.frame(ID   = rep(letters[1:3], each=3),
                 CatA = rep(1:3, times = 3),
                 CatB = letters[1:9])
lengthTime <- 3
nrRow <- nrow(df)
intDF <- df
for (i in 1:(lengthTime - 1)) {
  df <- rbind(df, intDF)
}
df$Time <- rep(1:lengthTime, each=nrRow)

ただ使えると思ったのですexpand.grid(df, 1:lengthTime)が、うまくいきません。outer運ももたらさなかった。それで、誰かが良い解決策を知っていますか?

4

6 に答える 6

61

expand.gridこの質問が投稿されてからしばらく経ちましたが、最近、タイトルにあるもの、つまりデータフレームで機能するものを探しているときに出くわしました。投稿された回答は、OP のより具体的な質問に対応しているため、誰かがデータ フレームのより一般的なソリューションを探している場合に備えて、もう少し一般的なアプローチを次に示します。

expand.grid.df <- function(...) Reduce(function(...) merge(..., by=NULL), list(...))

# For the example in the OP
expand.grid.df(df, data.frame(1:lengthTime))

# More generally
df1 <- data.frame(A=1:3, B=11:13)
df2 <- data.frame(C=51:52, D=c("Y", "N"))
df3 <- data.frame(E=c("+", "-"))
expand.grid.df(df1, df2, df3)
于 2014-02-20T14:48:38.137 に答える
19

df[rep(1:nrow(df),times = 3),]データフレームを拡張してから、上記のように余分な列を追加してみませんdf$Time <- rep(1:lengthTime, each=nrRow)か?

于 2012-07-27T18:39:28.380 に答える
13

クイックアップデート

パッケージ tidyr には、merge の代わりに使用できる cross() 関数もあり、少し高速で、tbl_df / tibble を返します。

data.frame(time=1:10) %>% merge(iris, by=NULL) 

data.frame(time=1:10) %>% tidyr::crossing(iris) 
于 2016-08-16T12:13:41.630 に答える
2

これは機能します:

REP <- rep(1:nrow(df), 3)
df2 <- data.frame(df[REP, ], Time = rep(1:3, each = 9))
rownames(df2) <- NULL
df2
于 2012-07-27T18:40:31.867 に答える
1

data.table解決策:

> library(data.table)
>  ( df <- data.frame(ID   = rep(letters[1:3], each=3),
+                  CatA = rep(1:3, times = 3),
+                  CatB = letters[1:9]) )
  ID CatA CatB
1  a    1    a
2  a    2    b
3  a    3    c
4  b    1    d
5  b    2    e
6  b    3    f
7  c    1    g
8  c    2    h
9  c    3    i
> ( DT <- data.table(df)[, lapply(.SD, function(x) rep(x,3))][, Time:=rep(1:3, each=nrow(df0))] )
    ID CatA CatB Time
 1:  a    1    a    1
 2:  a    2    b    1
 3:  a    3    c    1
 4:  b    1    d    1
 5:  b    2    e    1
 6:  b    3    f    1
 7:  c    1    g    1
 8:  c    2    h    1
 9:  c    3    i    1
10:  a    1    a    2
11:  a    2    b    2
12:  a    3    c    2
13:  b    1    d    2
14:  b    2    e    2
15:  b    3    f    2
16:  c    1    g    2
17:  c    2    h    2
18:  c    3    i    2
19:  a    1    a    3
20:  a    2    b    3
21:  a    3    c    3
22:  b    1    d    3
23:  b    2    e    3
24:  b    3    f    3
25:  c    1    g    3
26:  c    2    h    3
27:  c    3    i    3

別のもの:

> library(data.table)
>  ( df <- data.frame(ID   = rep(letters[1:3], each=3),
+                  CatA = rep(1:3, times = 3),
+                  CatB = letters[1:9]) )
> DT <- data.table(df)
> rbindlist(lapply(1:3, function(i) cbind(DT, Time=i)))
    ID CatA CatB Time
 1:  a    1    a    1
 2:  a    2    b    1
 3:  a    3    c    1
 4:  b    1    d    1
 5:  b    2    e    1
 6:  b    3    f    1
 7:  c    1    g    1
 8:  c    2    h    1
 9:  c    3    i    1
10:  a    1    a    2
11:  a    2    b    2
12:  a    3    c    2
13:  b    1    d    2
14:  b    2    e    2
15:  b    3    f    2
16:  c    1    g    2
17:  c    2    h    2
18:  c    3    i    2
19:  a    1    a    3
20:  a    2    b    3
21:  a    3    c    3
22:  b    1    d    3
23:  b    2    e    3
24:  b    3    f    3
25:  c    1    g    3
26:  c    2    h    3
27:  c    3    i    3
于 2015-08-25T18:16:27.783 に答える