私は何百もの大きな CSV ファイル (サイズはそれぞれ 10k 行から 100k 行までさまざまです) を持っていますが、それらのいくつかは、引用符内の引用符で不適切に形成された説明であるため、次のようになります。
ID,Description,x
3434,"abc"def",988
2344,"fred",3484
2345,"fr""ed",3485
2346,"joe,fred",3486
R のこれらすべての行を CSV としてきれいに解析できる必要があります。dput() して読んでいます...
txt <- c("ID,Description,x",
"3434,\"abc\"def\",988",
"2344,\"fred\",3484",
"2345,\"fr\"\"ed\",3485",
"2346,\"joe,fred\",3486")
read.csv(text=txt[1:4], colClasses='character')
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
incomplete final line found by readTableHeader on 'text'
引用符を変更し、コンマが埋め込まれた最後の行を含めない場合、うまく機能します
read.csv(text=txt[1:4], colClasses='character', quote='')
ただし、引用符を変更して、カンマが埋め込まれた最後の行を含めると...
read.csv(text=txt[1:5], colClasses='character', quote='')
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 1 did not have 4 elements
編集 x2: 残念ながら、説明の一部にコンマが含まれていると言うべきでした - コードは上記で編集されています。