4

df1df2の2つのデータフレームでリストデータを定義します

dats <- list( df1 = data.frame(a=sample(1:3), b = sample(11:13)),
    df2 = data.frame(a=sample(1:3), b = sample(11:13)))

> dats
$df1
  a  b
1 2 12
2 3 11
3 1 13

$df2
  a  b
1 3 13
2 2 11
3 1 12

各データフレームに変数aをドロップしたいと思います。次に、外部データフレームの各データフレームのIDを使用して、次のような変数を追加します。

ids <- data.frame(id=c("id1","id2"),df=c("df1","df2"))
> ids
  id  df
1 id1 df1
2 id2 df2

不要な変数を削除するために、運がなくてもこれを試しました。

> dats <- lapply(dats, function(x) assign(x, x[,c("b")]))  
> Error in assign(x, x[, c("b")]) : invalid first argument

IDを追加する方法もわかりません。

私も、おそらくもっと適切に試しました:

> temp <- lapply(dats, function(x) subset(x[1], select=x[[1]]$b))
Error in x[[1]]$b : $ operator is invalid for atomic vectors

私が混乱しているstr(out[1])のは、リストをstr(out[[1]])返し、データフレームを返すことです。それはそれと関係があるのではないかと思います。

4

2 に答える 2

5

idsまたは、これを試してください。データフレーム名をIDにマップする名前付きベクトルにを抽出します。

df2id <- ids$id
names(df2id) <- ids$df

> df2id
df1 df2 
id1 id2 
Levels: id1 id2

次に、(a)各データフレームから列をmapply削除し、a(b)列を追加するために使用しidます。

> mapply( function(d,x) cbind( subset(d, select = -a),
+                              id = x),
+         dats, df2id[ names(dats) ] ,
+         SIMPLIFY=FALSE)
$df1
   b  id
1 12 id1
2 11 id1
3 13 id1

$df2
   b  id
1 12 id2
2 11 id2
3 13 id2

df2id[ names(dats) ]--に渡すことに注意してください。mapplyこれにより、のデータフレームがのデータフレームとdf2id「整列」することが保証されdatsます。

于 2011-06-18T23:19:55.420 に答える
2

これでいい?

dats <- list( df1 = data.frame(a=sample(1:3), b = sample(11:13)),
    df2 = data.frame(a=sample(1:3), b = sample(11:13)))

ids <- data.frame(id=c("id1","id2"),df=c("df1","df2"))

# remove variable a
dats2 <- lapply(dats, function(x) x[,!names(x) == "a"])

# add id
for(i in 1:length(dats2)) {
  dats2[[i]] <- merge(dats2[[i]], ids$id[ids$df == names(dats2)[i]])
}

dats2

  $df1
     x   y
  1 11 id1
  2 12 id1
  3 13 id1

  $df2
     x   y
  1 11 id2
  2 12 id2
  3 13 id2
于 2011-06-18T22:39:52.957 に答える