6

R はアラビア語のテキストを正しく表示しません。アラビア語を使用すると、非常に奇妙なことがわかります。スクリーンショットは次のとおりです。

ここに画像の説明を入力

問題は、アラビア語のテキストでワードクラウドを作成したいということであり、最初にこの問題を解決する必要があります。

R バージョン: R 2.15.2 GUI 1.53 Leopard ビルド 64 ビット (6335)

詳細は次のとおりです。

> options("encoding")
$encoding
[1] "native.enc"

> Encoding("الله")
[1] "unknown"

セッション情報():

> sessionInfo()
R version 2.15.2 (2012-10-26)
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)

locale:
[1] C/C/C/C/de_DE/C

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] tools_2.15.2
> 

いじくり回し:

> x = "مرحبا"
> Encoding(x) = "UTF-8"
> x
[1] "<U+0645><U+0631><U+062D><U+0628><U+0627>"
> Encoding(iconv(x))
[1] "unknown"

より詳しい情報:

> Sys.getlocale()
[1] "C/C/C/C/de_DE/C"
> Sys.setlocale("LC_ALL", "en_US.utf8")
[1] ""
Warning message:
In Sys.setlocale("LC_ALL", "en_US.utf8") :
  OS reports request to set locale to "en_US.utf8" cannot be honored
> 

これで問題は解決しました:

Sys.setlocale("LC_ALL", "en_US.UTF-8")
4

2 に答える 2

0

UTF-8 ロケールを使用していなくても、この問題は発生していません (ロケールを変更しなくてもアラビア文字は正しく表示されます)。これをどうすればいいのかわからないので、他の誰かが私たちを啓発してください。

私は RStudio 0.98.1091 を使用しており、私の sessionInfo は次のとおりです。

> sessionInfo()
R version 3.1.2 (2014-10-31)
Platform: i386-w64-mingw32/i386 (32-bit)

locale:
[1] LC_COLLATE=French_France.1252  LC_CTYPE=French_France.1252    LC_MONETARY=French_France.1252
[4] LC_NUMERIC=C                   LC_TIME=French_France.1252    
于 2015-02-05T10:16:48.247 に答える