Rに(繁体字)漢字を含むUTF-8エンコードされた.csvファイルを開こうとしました。何らかの理由で、Rは情報を漢字として表示することも、Unicode文字として表示することもあります。
例えば:
data <-read.csv("mydata.csv", encoding="UTF-8")
data
ユニコード文字を生成しますが、次のようになります。
data <-read.csv("mydata.csv", encoding="UTF-8")
data[,1]
実際には漢字が表示されます。
マトリックスに変換すると漢字も表示されますが、データを確認しようとすると(コマンドView(data)またはfix(data))、再びユニコードになります。
Macを使っている人(私はPC、Windows 7を使っています)にアドバイスを求めましたが、中には漢字を使っている人もいれば、持っていない人もいます。代わりに、元のデータをテーブルとして保存し、この方法でRに読み込んでみました。同じ結果です。RStudio、Revolution R、およびRGuiでスクリプトを実行してみました。ロケールを調整しようとしましたが(中国語など)、Rで変更できなかったか、Unicode文字ではなくぎこちない結果になりました。
私の現在のロケールは次のとおりです。
"LC_COLLATE = French_Switzerland.1252; LC_CTYPE = French_Switzerland.1252; LC_MONETARY = French_Switzerland.1252; LC_NUMERIC = C; LC_TIME = French_Switzerland.1252"
Rに一貫して漢字を表示させるための助けをいただければ幸いです...