2

XMLR パッケージを使用してオンライン XML データを取得しています。私の問題は、への呼び出し中に UTF-8 エンコーディングが失われることxmlToListです。たとえば、「é」は「é」に置き換えられます。これは、XML の解析中に発生します。

以下はコード スニペットです。エンコーディングが失われた例と、エンコーディングが保持されている例 (データ ソースによって異なります) があります。

library(XML)
library(RCurl)

url = "http://www.bdm.insee.fr/series/sdmx/data/DEFAILLANCES-ENT-FR-ACT/M.AZ+BE.BRUT+CVS-CJO?lastNObservations=2"
res <- getURL(url)
xmlToList(res)
# encoding lost

url2 = "http://www.bdm.insee.fr/series/sdmx/conceptscheme/"
res2 <- getURL(url2)
xmlToList(res2)
# encoding kept

エンコーディングに関する動作が異なるのはなぜですか? .encoding = "UTF-8"getURL、に設定しようとしましenc2utf8(res)たが、変更はありません。

どんな助けでも大歓迎です!

ありがとう、

ジェレミー

R version 3.2.1 (2015-06-18)
Platform: i386-w64-mingw32/i386 (32-bit)
Running under: Windows 7 (build 7601) Service Pack 1

locale:
[1] LC_COLLATE=French_France.1252  LC_CTYPE=French_France.1252   
[3] LC_MONETARY=French_France.1252 LC_NUMERIC=C                  
[5] LC_TIME=French_France.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] RCurl_1.95-4.7 bitops_1.0-6   XML_3.98-1.3  

loaded via a namespace (and not attached):
[1] tools_3.2.1
4

1 に答える 1