約 94 列と 300 万行からなる大きなデータ セットがあります。このファイルには、列間の区切り文字として単一のスペースと複数のスペースがあります。R でこのファイルからいくつかの列を読み取る必要があります。このために、以下のコードで確認できるオプションを指定して read.table() を使用してみました。
### Defining the columns to be read from the file, the first 5 column, then we do not read next 24, after this we read next 5 columns. Last 60 columns are not read in-
col_classes = c(rep("character",2), rep("numeric", 3), rep("NULL",24), rep("numeric", 5), rep("NULL", 60))
### Reading first 100 rows of the data
data <- read.table(file, sep = " ",header = F, nrows = 100, na.strings ="", stringsAsFactors= F)
読み込まなければならないファイルには、いくつかの列の間の区切り文字として複数のスペースがあるため、上記の方法は機能しません。このファイルを効率的に読み取る方法はありますか。