r - data.frame の列数を 1 に減らすことができる場合に factor への変換を防止する

Question

列の条件のリストに基づいてデータフレームから項目を抽出できる手順があります ( (column_name = value) リストとして指定された基準を使用して R データフレームから項目を抽出するを参照)。

データフレームと条件リストは次のとおりです。

> experimental_plan_1
  lib genotype treatment replicate
1   A       WT    normal         1
2   B       WT       hot         1
3   C      mut    normal         1
4   D      mut       hot         1
5   E       WT    normal         2
6   F       WT       hot         2
7   G      mut    normal         2
8   H      mut       hot         2
> condition_1 <- list(genotype="WT", treatment="normal")

lib私の目標は、リストで指定された基準に対応する行の列の値を抽出することです。

次の関数を使用して、必要な値を抽出できます。

> get_libs <- function(experimental_plan, condition) {experimental_plan[apply((experimental_plan[, names(condition)] == condition), 1, all), "lib"]}

これは、上記のデータフレームでうまく機能します。

> get_libs(experimental_plan_1, condition_1)
[1] A E
Levels: A B C D E F G H

ただし、これをより一般的にしたいと思います: Myexperimental_planとcondition異なる列を持つことができます:

> experimental_plan_2
  lib genotype replicate
1   A       WT         1
2   B       WT         2
3   C       WT         3
4   D      mut         1
5   E      mut         2
6   F      mut         3
> condition_2 <- list(genotype="WT")

今回は失敗します：

> get_libs(experimental_plan_2, condition_2)
Error in apply((experimental_plan[, names(condition)] == condition), 1,  : 
  dim(X) must have a positive length

この場合、予想される出力は次のようになります。

[1] A B C
Levels: A B C D E F

より堅牢な方法で同じことを実行する関数を作成するにはどうすればよいですか?

> class(experimental_plan_1)
[1] "data.frame"
> class(experimental_plan_2)
[1] "data.frame"
> class(names(condition_1))
[1] "character"
> class(names(condition_2))
[1] "character"
> class(experimental_plan_1[, names(condition_1)])
[1] "data.frame"
> class(experimental_plan_2[, names(condition_2)])
[1] "factor"

これは最小の驚きの原則に反します。同じタイプの入力が与えられた場合、計算は同じタイプの出力を返すと思います。

r - data.frame の列数を 1 に減らすことができる場合に factor への変換を防止する

コメント

0 に答える 0

r - data.frame の列数を 1 に減らすことができる場合に factor への変換を防止する

コメント

0 に答える 0

Related

Reference