私は常にExcelファイルをCSVファイルに変換して、次のようにRにインポートします。
myDataFrame <- read.csv("mydatafile.csv", stringsAsFactors=F)
しかし、中国語で書かれた xlsx ファイルを変換すると、重大な問題が発生しました。ほとんどの文字 (すべてではない) に「??」が表示される エンコーディングのため。
そこで、xlsx
パッケージを使用して直接インポートすることにしました。しかし、問題は、Excel ファイルのサイズが 10MB を超えることです。JVM のメモリ制限のため、エラー メッセージが表示されました。(xlsx
内部でJavaを使用していると思います。)
.jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, のエラー:
java.lang.OutOfMemoryError: GC オーバーヘッド制限を超えました
中国語のExcelファイルをRにインポートするにはどうすればよいですか? 「名前を付けて保存..」CSVファイルを試し、メモ帳で開き、オプション「UTF-8」で保存しました。しかし、結果は同じでした(「??」が表示されます)。
参考までに、元の Excel ファイルで完全な漢字を確認できます。