10

csv ファイルを R に読み込もうとしましたが、切断され続けます。ファイルのエンコードが原因かもしれないと思いますが、よくわかりません。

私が実行したコードは次のとおりです。

read.csv('crunchbase_companies_2.csv', fileEncoding="UTF-8", quote="")

次に、警告メッセージが表示されますIn scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,: invalid input found on input connection

Rはデータを読み取りますが、特殊文字にヒットして停止するまでのみです。したがって、R では部分的なデータしか得られません。ここで取得したデータを貼り付けました: http://pastebin.com/EQLnXz2W。「Ì」などに当たると切れますが注意してください。したがって、これらの文字はサンプル データには含まれていません。

を使用して端末のエンコーディングも確認しましたfile。返しますNon-ISO extended-ASCII English text, with CR line terminators

データセット全体を読み取るにはどうすればよいですか?

4

3 に答える 3

8

そのため、理由はよくわかりませんが、最終的に機能したのは、 read.csv 関数を呼び出すときに変更fileEncodingされています。latin1

これは、別の回答hereで言及されています。どういうわけか、それは私が試していなかったものの1つです...

于 2013-10-26T19:58:59.103 に答える