0 投票する

3 に答える

3031 参照

r - sdmx-xmlファイルをRのデータフレームに読み込む

SDMX-XMLファイルをデータフレームに読み込むことができた人はいないかと思いました。読みたいファイルはhttps://www.ecb.europa.eu/stats/sdmx/icpf/1/data/pension_funds.xml（1mb）です。ファイルを「pensions_funds.xml」としてpwdに保存し、XMLパッケージを使用して読み取ろうとしました。

上記の数行は基本的にここの例http://www.omegahat.org/RSXML/gettingStarted.htmlに従いますが、最初にヘッダーを無視する必要があると思います（ファイルの最初の数ページの下に貼り付けました読み込もうとしています）。したがって、上記は機能する可能性があると思いますが、私の目的では間違ったノードから開始します。time_periodとref_areaでインデックス付けされたobs_valuesを取得したいと思います。

まず、適切なノードを見つけてそこから開始しますが、データ形式に関する知識が限られており、XMLパッケージをSDMX-XMLファイルに使用できるかどうかわからないため、私はばか者の用事になっているのではないかと思います。より賢い人々がこれをやろうとしたようです http://opensdmxdevelopers.wikispaces.com/RSDMXダウンロード用のこのパッケージがここのホームページ https://r-forge.r-project.org/projects/rsdmx に見つかりません / （リンク/ダウンロードセクションは表示されませんが、盲目である可能性があります）そしてそれは初期段階のようです。rsdmxの存在は、xmlパッケージを使用してsdmxを読み取るのは簡単ではない可能性があることを示唆しているため、誰かがこれに成功しない限り、この段階で諦める準備ができています。実際、私は主にこのファイルを読むことに興味があります http://www.ecb.europa.eu/stats/sdmx/bsi/1/data/outstanding_amounts.xml しかし、これは10 MBのファイルなので、小さく始めていました。

edit3 Mischaのコメントライブラリ（ "XML"）の変更を使用して、大きなファイルに対してsgibbの回答を試行します

edit2：sgibb からの回答は理想的に見え、小さいファイルで完全に機能します。私はそれを実行しようとしました

（10mbファイル、元のリンクが修正されました）、2行の追加のみが変更されています。

（これらは、この大きなデータセットの行を識別するために必要な追加のid変数です）。数分間実行された後、次のエラーで終了しました。

エラー：1：属性TIME_PEの仕様マンデート値
2：属性構成エラー
3：開始タグObs行の終わりが見つかりませんでした20743
4：タグシリーズのデータの終わりが早すぎる20689
5：タグDataSetのデータの終わりが早すぎる91行6：タグCompactData行2のデータの途中で終了

さらに：50以上の警告がありました（最初の50を表示するにはwarnings（）を使用してください）

データの基本的な形式は非常に似ているように見えるので、これでうまくいくのではないかと思いました。10MBファイルの基本フォーマットは以下の通りです。

edit1：

必要なデータ形式：

これがデータの最初のビットです。

r xml dataset sdmx

2012-08-13T10:15:43.953

0 投票する

0 に答える

827 参照

xml - XML ドキュメントを MATLAB に変換する

XML ドキュメントを、ノードを反復処理して情報をフェッチできる便利な matlab オブジェクトに変換したいと考えています。XML ドキュメントは、次のように少し複雑です。

xmlread('filename.xml') を使用して xml.getElementsByTagName('Header') を書き込むと、次のようになります。

助けていただければ幸いです。

前もって感謝します！

xml matlab sdmx

2013-11-21T10:13:55.613

0 投票する

2 に答える

1224 参照

xml - 統計データとメタデータの交換 (SDMX)

SDMXについて (プログラミングコード) を研究するための十分なリソースが見つからないため、 SDMXに固執しました。

お気に入り：-

はい、個人のウェブサイトにいくつかのガイドラインがありますが、それらはsdmxに乗り始めるのに十分ではありません. ですから、経験があれば、私の友人全員に私の個人的な要求を共有してください。

どんな助けでも大歓迎です

xml xsd xml-parsing schema sdmx

2014-05-22T05:50:16.410

0 投票する

2 に答える

288 参照

r - RでSDMXを読む - 解析エラー?

最近開始されたSDMXサービスを通じて、INEGI（メキシコ統計局）のデータを使用してRで光沢のあるアプリを開発しようとしています。私は開発者自身に連絡するところまで行きましたが、彼らは私に次の実行できないコードをくれました:

これにより、次のエラーが発生します。

...など、要点がわかります。

私は別の URL を使用しようとしました (おそらくこれは広範であり、すべての GDP 測定値をもたらしました) が、同じ結果が得られます:

ブラウザでファイルを直接ダウンロードすると、有用な構造が得られているようです。

何か案は？これは、ソースからの直接の誤った定義のように見えますか、それともパッケージ「rsdmx」の問題のように見えますか?もしそうなら、誰かが同様の構造を正しく解析する方法を見つけましたか?

r xml parsing sdmx

2015-02-21T05:52:39.320

0 投票する

1 に答える

359 参照

r - Eurostat Bulk SDMX データを R にダウンロードしますか?

Eurostat から大量のデータをダウンロードしようとして問題が発生しました。助けていただければ幸いです。この投稿からコードを基にしました。

この警告を受け取りましたが、データフレームは空です:

r sdmx

2015-05-31T22:13:17.773

0 投票する

1 に答える

775 参照

python - Eurostat SDMX データフローの説明 python

Python を使用して、Eurostat から可能なすべてのデータフローのリストを収集したいと考えています。次のコードがあります。

これにより、考えられるすべての resource_id のリストが得られますが、記述子も必要です。これは可能ですか？

ありがとう

python sdmx

2015-09-10T11:03:22.530

0 投票する

1 に答える

588 参照

r - R で XML を読み取るときにエンコーディングが失われる

XMLR パッケージを使用してオンライン XML データを取得しています。私の問題は、への呼び出し中に UTF-8 エンコーディングが失われることxmlToListです。たとえば、「é」は「é」に置き換えられます。これは、XML の解析中に発生します。

以下はコードスニペットです。エンコーディングが失われた例と、エンコーディングが保持されている例 (データソースによって異なります) があります。

エンコーディングに関する動作が異なるのはなぜですか? .encoding = "UTF-8"、getURL、に設定しようとしましenc2utf8(res)たが、変更はありません。

どんな助けでも大歓迎です!

ありがとう、

ジェレミー

r xml encoding utf-8 sdmx

2015-10-28T10:30:16.847

0 投票する

3 に答える

114 参照

r - 奇妙なフォーマッター CSV ファイルの読み取り

私は、statistics.gov.scot Web サイトからいくつかのデータをダウンロードしようとしています。たとえば、入院率に関するデータを入手したいと思います。関心のあるデータテーブルを取得するためのクエリの形式は次のとおりです。

試してみたい人は、このリンクからアクセスできます。クエリ*.CSVは関連情報を含むファイルを生成しますが、ファイルの形式にはいくつかの課題があります。

ファイル例

ファイルの内容は次のようになります。

Excel にインポートする場合:

ただし、経由でRにインポートするread.csvと、次のようになります。

問題

read.csvインポートは 2 つの列のみを返します。問題は、最初の列の一部が空であることに関連していると推測しています。このファイルを、Excel で図解されたインポートと同様の方法で読みたいと考えています。ポイントは、列Aと列Bで行7の値を使用するつもりであり、当然、以下のデータテーブルを使用することです。を生成するという点では、空のセルがある場合に値を含めたいと思いますが、Excel の値と同等の次元になります。私は試した：data.frameNA

しかし、私は同じ問題に到達し続けます。

望ましい結果

望ましい結果は次のようになります(手動で生成された抜粋)。

スクリーンショット

さらに説明するために、ディメンションを維持し、欠損値にNAsを入力します。

r csv import read.csv sdmx

2016-03-15T10:58:32.517

問題タブ [sdmx]

ファイル例

問題

望ましい結果

スクリーンショット

Reference