作業ディレクトリの各ファイルから特定のセルを使用して新しいデータフレームを作成できるかどうか疑問に思っています。たとえば、次のような 2 つのデータ フレームがあるとします (数字はランダムなので無視してください)。
各データセットで、行 4 は値の合計で、行 5 は欠損値の数です。欠損値の数を「M」、列の合計を「N」として表す場合、達成しようとしているのは次の表です。
したがって、各ファイル 'N' と 'M' は 1 つの行にあります。
ディレクトリに多くのファイルがあるので、それらをリストで読みましたが、ファイルのリストでそのようなタスクを実行する最良の方法がわかりません。
これは、私が示したテーブルのサンプルコードと、リストでそれらを読み取る方法です:
##Create sample data
df = data.frame(Type = 'wind', v1=c(1,2,3,100,50), v2=c(4,5,6,200,60), v3=c(6,7,8,300,70))
df2 =data.frame(Type = 'test', v1=c(3,2,1,400,40), v2=c(2,3,4,500,30), v3=c(6,7,8,600,20))
# write to directory
write.csv(df, file = "sample1.csv", row.names = F)
write.csv(df2, file = "sample2.csv", row.names = F)
# read to list
mycsv = dir(pattern=".csv")
n <- length(mycsv)
mylist <- vector("list", n)
for(i in 1:n) mylist[[i]] <- read.csv(mycsv[i],header = TRUE)
これが可能かどうか、またどのようにアプローチすればよいかについて、何か提案をいただければ幸いです。
どうもありがとう、
アヤン