cbc.read.table
a)Rのパッケージから関数を使用して比較的大きな.txtファイルを読み込もうとしていcolbycol
ます。私が読んでいたことによると、このパッケージは、大きなファイル(1 GB以上を読み込む)がある場合の作業を容易にしますR) 分析にすべての列/変数は必要ありません。また、関数が同じのパラメーターcbc.read.table
をサポートできることを読みました。read.table
ただし、パラメーターを渡すとnrows
(R でファイルのプレビューを取得するために)、次のエラーが発生します。
#My line code. I'm just reading columns 5,6,7,8 out of 27
i.can <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=5:8, nrows=20)
#error message
Error in read.table(file, nrows = 50, sep = sep, header = header, ...) :
formal argument "nrows" matched by multiple actual arguments
それで、私の質問は、この問題をどのように解決できるか教えていただけますか?
b) その後、次のコードですべてのインスタンスを読み取ろうとしました。
i.can.b <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=4:8) #done perfectly
my.df <- as.data.frame(i.can.b) #getting error in this line
Error in readSingleKey(con, map, key) : unable to obtain value for key 'Company' #Company is a string column in my data set
それで、私の質問は再びです:どうすればこれを解決できますか?
c) ファイルの読み取り中に (インスタンスの条件によって) フィルター処理する方法を知っていますか?