8

このようなデータフレームがあります

1    1    1    K    1    K    K
2    1    2    K    1    K    K
3    8    3    K    1    K    K
4    8    2    K    1    K    K
1    1    1    K    1    K    K
2    1    2    K    1    K    K

同じ値、つまりKを持つすべての列を削除したいので、結果は次のようになります。

1    1    1    1    
2    1    2    1   
3    8    3    1  
4    8    2    1  
1    1    1    1 
2    1    2    1  

for by列で反復しようとしましたが、何も得られませんでした。何か案は?

4

4 に答える 4

4

タイプに関係なく、複数の値を持つ列を選択するには:

uniquelength <- sapply(d,function(x) length(unique(x)))
d <- subset(d, select=uniquelength>1)

(おっと、Romanの質問は正しいです-これはあなたのコラム5もノックアウトする可能性があります)

多分(編集:コメントのおかげで!)

isfac <- sapply(d,inherits,"factor")
d <- subset(d,select=!isfac | uniquelength>1)

また

d <- d[,!isfac | uniquelength>1]
于 2011-12-05T16:33:19.237 に答える
3

これは、複製された列(たとえば、複製された文字、数値、または因数分解列のペアを含む)を削除するために機能するソリューションです。それが私がOPの質問を読んだ方法であり、それが誤読であったとしても、それも興味深い質問のように思えます。

df <- read.table(text=" 
1    1    1    K    1    K    K
2    1    2    K    1    K    K
3    8    3    K    1    K    K
4    8    2    K    1    K    K
1    1    1    K    1    K    K
2    1    2    K    1    K    K")

# Need to run duplicated() in 'both directions', since  it considers
# the first example to be **not** a duplicate.
repdCols <- as.logical(duplicated(as.list(df), fromLast=FALSE) + 
                       duplicated(as.list(df), fromLast=TRUE))
# [1] FALSE FALSE FALSE  TRUE FALSE  TRUE  TRUE

df[!repdCols]
#   V1 V2 V3 V5
# 1  1  1  1  1
# 2  2  1  2  1
# 3  3  8  3  1
# 4  4  8  2  1
# 5  1  1  1  1
# 6  2  1  2  1
于 2011-12-05T18:31:51.637 に答える
2

これを行う別の方法は、高階関数を使用することですFilter。これがコードです

to_keep <- function(x) any(is.numeric(x), length(unique(x)) > 1)
Filter(to_keep, d)
于 2011-12-05T18:18:48.130 に答える
2

ワンライナーソリューション。

df2 <- df[sapply(df, function(x) !is.factor(x) | length(unique(x))>1 )]
于 2011-12-05T21:48:02.653 に答える