csv ファイルを R に読み込もうとしましたが、切断され続けます。ファイルのエンコードが原因かもしれないと思いますが、よくわかりません。
私が実行したコードは次のとおりです。
read.csv('crunchbase_companies_2.csv', fileEncoding="UTF-8", quote="")
次に、警告メッセージが表示されますIn scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,: invalid input found on input connection
。
Rはデータを読み取りますが、特殊文字にヒットして停止するまでのみです。したがって、R では部分的なデータしか得られません。ここで取得したデータを貼り付けました: http://pastebin.com/EQLnXz2W。「Ì」などに当たると切れますが注意してください。したがって、これらの文字はサンプル データには含まれていません。
を使用して端末のエンコーディングも確認しましたfile
。返しますNon-ISO extended-ASCII English text, with CR line terminators
。
データセット全体を読み取るにはどうすればよいですか?