からいくつかのデータがあり、それをRにロードしようとしています。.csv ファイルで、Excel と OpenOffice の両方でデータを表示できます。(興味がある方は、ここで入手できる Elections Canada データからの 2011 年の世論調査結果データを参照してください)。
データは異常な方法でコード化されています。典型的な行は次のとおりです。
12002,Central Nova","Nova-Centre"," 1","River John",N,N,"",1,299,"Chisholm","","Matthew","Green Party","Parti Vert",N,N,11
"
Central-Nova の最後にはがありますが、最初にはありません。したがって、データを読み取るために、引用符を抑制しました。これは、最初のいくつかのファイルではうまくいきました。すなわち。
test<-read.csv("pollresults_resultatsbureau11001.csv",header = TRUE,sep=",",fileEncoding="latin1",as.is=TRUE,quote="")
問題は次のとおりです。別のファイル (例: pollresults_resultatsbureau12002.csv) に、次のようなデータ行があります。
12002,Central Nova","Nova-Centre"," 6-1","Pictou, Subd. A",N,N,"",0,168,"Parker","","David K.","NDP-New Democratic Party","NPD-Nouveau Parti democratique",N,N,28
引用符を抑制する必要があるため、このエントリ"Pictou, Subd. A"
により、Rはこれを 2 つの変数に分割する必要があります。データフレームの構築の途中で列を追加したいため、データを読み込むことができません。
Excel と OpenOffice はどちらもこれらのファイルを問題なく開くことができます。どういうわけか、Excel と OpenOfficeは、変数エントリの先頭にある場合にのみ引用符が重要であることを認識しています。
このデータを取得するためにRで有効にする必要があるオプションを知っていますか? ロードする必要があるファイルが 300 個を超えているため (それぞれに最大 1000 行あります)、手動で修正することはできません...
解決策をあちこち探しましたが、見つかりません。