インポートしようとしている200,000行のファイルがありますが、エラーが発生します。
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 39194 did not have 10 elements
その行をless -N
(「39000e」と入力して目的の行にスキップするだけで)違いがわからないので、split -l 30000 optimized_bail_1127.csv
以前はチャンクに分割して、小さい部分をインポートして追加(または調査)してみました。 。
split
「xaa」、「xab」、... xagなどの名前のファイルの束を生成します。したがって、次のようなことをしたいと思います。
files <- dir(pattern="xa[a-g]")
for(f in files) {
print (f)
f <- read.table(f,sep = '|')
}
各サブファイルのテーブルを取得します。また、エラーをスキップして(印刷しますが、続行します)、少なくともこれらのうちどれだけをきれいにインポートできるかを確認できるようにしたいと思います。