Windowsで非ネイティブ文字を使用してRコードを解析すると、これらの文字はUnicode表現に変換されているように見えます。
Encoding('ğ')
# [1] "UTF-8"
parse(text="'ğ'")
# expression('<U+011F>')
parse(text="'ğ'", encoding='UTF-8')
# expression('<U+011F>')
deparse(parse(text="'ğ'")[1])
# [1] "expression(\"<U+011F>\")"
eval(parse(text="'ğ'"))
# [1] "<U+011F>"
私のロケールは簡体字中国語なので、このような問題なしに漢字を含むコードを解析できます。
parse(text="'你好'")
# expression('你好')
ğ
私の質問は、この例の文字のような文字をどのように保存できるかということです。または、少なくともdeparse()
、式の後に元の文字を「再構築」するにはどうすればよいですか?
私のセッション情報:
> sessionInfo()
R version 2.15.2 (2012-10-26)
Platform: i386-w64-mingw32/i386 (32-bit)
locale:
[1] LC_COLLATE=Chinese (Simplified)_People's Republic of China.936
[2] LC_CTYPE=Chinese (Simplified)_People's Republic of China.936
[3] LC_MONETARY=Chinese (Simplified)_People's Republic of China.936
[4] LC_NUMERIC=C
[5] LC_TIME=Chinese (Simplified)_People's Republic of China.936
attached base packages:
[1] stats graphics grDevices utils datasets methods base