r - データフレームから特定の列を抽出する

Question

6 列の R データフレームがあり、列が 3 つしかない新しいデータフレームを作成したいと考えています。

データフレームがで、列、、およびdfを抽出したい場合、これが私が理解できる唯一のコマンドです。ABE

 data.frame(df$A,df$B,df$E)

これを行うよりコンパクトな方法はありますか？

score 494 · Accepted Answer

列名のベクトルを使用してサブセット化できます。subset()特に関数、パッケージ、またはアプリケーションでプログラミングする場合は、列名をオブジェクト名のように扱う方法 (例: ) よりも、この方法を強く好みます。

# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[c("A","B","E")]

コンマがないことに注意してください (つまり、ではありませんdf[,c("A","B","C")])。これdf[,"A"]は、データフレームではなくベクトルを返すためです。ただし、df["A"]常にデータフレームを返します。

str(df["A"])
## 'data.frame':    1 obs. of  1 variable:
## $ A: int 1
str(df[,"A"])  # vector
##  int 1

data.frameの代わりにベクトルを返すことを指摘してくれたDavid Dorchiesと、元のソリューション (以下) のより良い代替案 (上記) を提案してくれたAntoine Fabriに感謝します。df[,"A"]

# subset (original solution--not recommended)
df[,c("A","B","E")]  # returns a data.frame
df[,"A"]             # returns a vector

score 222 · Accepted Answer

data.frame が呼び出された場合、 dplyrパッケージを使用しdf1ます。

library(dplyr)

df1 %>%
  select(A, B, E)

これは、%>%パイプなしで次のように書くこともできます。

select(df1, A, B, E)

score 110 · Accepted Answer

これがsubset()関数の役割です。

> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> subset(dat, select=c("A", "B"))
  A B
1 1 3
2 2 4

score 86 · Accepted Answer

明らかな選択肢が 2 つあります。Joshua Ulrich のdf[,c("A","B","E")]または

df[,c(1,2,5)]

のように

> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> df
  A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
  A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
  A B E
1 1 3 8
2 2 4 8

score 19 · Accepted Answer

19

df1 は元のデータフレームです。

df2 <- subset(df1, select = c(1, 2, 5))

于 2016-06-10T11:34:19.543 に答える

score 15 · Accepted Answer

sqldfRデータフレームで選択を実行するパッケージを次のように使用することもできます:

df1 <- sqldf("select A, B, E from df")

df1これにより、列 A、B、E を含むデータフレームが出力として得られます。

score 0 · Accepted Answer

[ およびサブセットは代入できません。

[1 つの列のみが選択されている場合、ベクトルを返します。

df = data.frame(a="a",b="b")    

identical(
  df[,c("a")], 
  subset(df,select="a")
) 

identical(
  df[,c("a","b")],  
  subset(df,select=c("a","b"))
)

r - データ フレームから特定の列を抽出する

10 に答える 10

Related

Reference

r - データフレームから特定の列を抽出する