2番目のデータセットに格納されているメタデータに基づいてデータセットから列を抽出する方法について誰かが提案していますか?比較的簡単な方法があるかどうか疑問に思っています(たとえば、「colnames」または「subset」を使用する)。私の元のデータセットは非常に大きく、100列以上と30,000行以上あります。ファイルを開いてExcelで選択するのは面倒です。
ここに2つのデータセットの例があります。
set1 <- data.frame(ID = rnorm(5, 5000, 1000), Sample1 = rnorm(5, 50000, 2500),
Sample2 = rnorm(5, 50000, 2500), Sample3 = rnorm(5, 50000, 2500),
Sample4 = rnorm(5, 50000, 2500), Sample5 = rnorm(5, 50000, 2500))
meta.data <- data.frame(Sample_name = c("Sample1", "Sample2", "Sample3",
"Sample4", "Sample5"), Location = c("Loc1", "Loc2", "Loc3", "Loc1", "Loc1"),
Time = c("M0", "M01", "M02", "M02", "M03"),
Conc = c("lo", "hi", "lo", "lo", "lo"))
(1)ロケーションLoc1からのすべてのサンプルまたは時間M02からのすべてのサンプルを(新しいデータセットとして)抽出するにはどうすればよいですか?
(2)特定のID番号を持つ行を抽出し、その行内で濃度「lo」を持つサンプルのみを選択するにはどうすればよいですか?