1

何人かの人々がユーロスタットのウェブサイトからデータをダウンロードする必要があることは知っていますが (例: http://bit.ly/HrDTgTを参照 )、私が探しているのは一括ダウンロードではなく、適切にフォーマットされた (小さい) CSV ファイル。たとえば、次のスニペットを考えてみましょう

library(XML)

mylines <- readLines(url("http://bit.ly/1czdbRq"))
closeAllConnections()
mylist <- readHTMLTable(mylines,## stringsAsFactors = FALSE ,
                    asText=TRUE)
mytable <- mylist$xTable

それはすでに私が必要としているものに近いですが、修正できないことがいくつかあります。1) 列名が失われている 2) 数値だけが残っています。数字が参照する国と統計指標の (最終的な) レベル/単位に関するすべての情報を失います。

それを改善する方法についてのアイデアはありますか(おそらくRで)?乾杯

ロレンツォ

4

1 に答える 1

1

@Sergey で示されているように、SDMX Web サービスを使用して Eurostat からデータを照会できます。SDMX Eurostat REST API を使用すると、このデータは (フィルターを指定した場合でも) 1 つの Web URL になります ( SDMX データ クエリを作成するには、 Eurostat の指示を参照してください)。

R では、rsdmxパッケージを使用してデータを読み取ることができます。以下の例を参照してください。

#in case you want to install rsdmx from Github
#(otherwise you can install it from CRAN)
require(devtools)
install_github("rsdmx", "opensdmx")
require(rsdmx)

#read EUROSTAT dataset
dataURL <- "http://ec.europa.eu/eurostat/SDMX/diss-web/rest/data/cdh_e_fos/..PC.FOS1.BE/?startperiod=2005&endPeriod=2011 "
sdmx <- readSDMX(dataURL)
stats <- as.data.frame(sdmx)
head(stats)

注: CRANから rsdmx を見つけるか、GitHub リポジトリから直接インストールできます。https://github.com/opensdmx/rsdmx

さらに例が必要な場合は、 rsdmx wikiを確認してください。

于 2014-10-26T15:42:09.750 に答える