問題タブ [sdmx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - sdmx-xmlファイルをRのデータフレームに読み込む
SDMX-XMLファイルをデータフレームに読み込むことができた人はいないかと思いました。読みたいファイルはhttps://www.ecb.europa.eu/stats/sdmx/icpf/1/data/pension_funds.xml(1mb)です。ファイルを「pensions_funds.xml」としてpwdに保存し、XMLパッケージを使用して読み取ろうとしました。
上記の数行は基本的にここの例http://www.omegahat.org/RSXML/gettingStarted.htmlに従います が、最初にヘッダーを無視する必要があると思います(ファイルの最初の数ページの下に貼り付けました読み込もうとしています)。したがって、上記は機能する可能性があると思いますが、私の目的では間違ったノードから開始します。time_periodとref_areaでインデックス付けされたobs_valuesを取得したいと思います。
まず、適切なノードを見つけてそこから開始しますが、データ形式に関する知識が限られており、XMLパッケージをSDMX-XMLファイルに使用できるかどうかわからないため、私はばか者の用事になっているのではないかと思います。より賢い人々がこれをやろうとしたようです http://opensdmxdevelopers.wikispaces.com/RSDMXダウンロード用のこのパッケージがここのホームページhttps://r-forge.r-project.org/projects/rsdmx に見つかりません / (リンク/ダウンロードセクションは表示されませんが、盲目である可能性があります)そしてそれは初期段階のようです。rsdmxの存在は、xmlパッケージを使用してsdmxを読み取るのは簡単ではない可能性があることを示唆しているため、誰かがこれに成功しない限り、この段階で諦める準備ができています。実際、私は主にこのファイルを読むことに興味があります http://www.ecb.europa.eu/stats/sdmx/bsi/1/data/outstanding_amounts.xml しかし、これは10 MBのファイルなので、小さく始めていました。
edit3 Mischaのコメントライブラリ( "XML")の変更を使用して、大きなファイルに対してsgibbの回答を試行します
edit2:sgibb からの回答は理想的に見え、小さいファイルで完全に機能します。私はそれを実行しようとしました
(10mbファイル、元のリンクが修正されました)、2行の追加のみが変更されています。
(これらは、この大きなデータセットの行を識別するために必要な追加のid変数です)。数分間実行された後、次のエラーで終了しました。
エラー:1:属性TIME_PEの仕様マンデート値
2:属性構成エラー
3:開始タグObs行の終わりが見つかりませんでした20743
4:タグシリーズのデータの終わりが早すぎる20689
5:タグDataSetのデータの終わりが早すぎる91行6:タグCompactData行2のデータの途中で終了
さらに:50以上の警告がありました(最初の50を表示するにはwarnings()を使用してください)
データの基本的な形式は非常に似ているように見えるので、これでうまくいくのではないかと思いました。10MBファイルの基本フォーマットは以下の通りです。
edit1:
必要なデータ形式:
これがデータの最初のビットです。
xml - XML ドキュメントを MATLAB に変換する
XML ドキュメントを、ノードを反復処理して情報をフェッチできる便利な matlab オブジェクトに変換したいと考えています。XML ドキュメントは、次のように少し複雑です。
xmlread('filename.xml') を使用して xml.getElementsByTagName('Header') を書き込むと、次のようになります。
助けていただければ幸いです。
前もって感謝します!
xml - 統計データとメタデータの交換 (SDMX)
SDMXについて (プログラミング コード) を研究するための十分なリソースが見つからないため、 SDMXに固執しました。
お気に入り:-
はい、個人のウェブサイトにいくつかのガイドラインがありますが、それらはsdmxに乗り始めるのに十分ではありません. ですから、経験があれば、私の友人全員に私の個人的な要求を共有してください。
どんな助けでも大歓迎です
r - RでSDMXを読む - 解析エラー?
最近開始されたSDMXサービスを通じて、INEGI(メキシコ統計局)のデータを使用してRで光沢のあるアプリを開発しようとしています。私は開発者自身に連絡するところまで行きましたが、彼らは私に次の実行できないコードをくれました:
これにより、次のエラーが発生します。
...など、要点がわかります。
私は別の URL を使用しようとしました (おそらくこれは広範であり、すべての GDP 測定値をもたらしました) が、同じ結果が得られます:
ブラウザでファイルを直接ダウンロードすると、有用な構造が得られているようです。
何か案は?これは、ソースからの直接の誤った定義のように見えますか、それともパッケージ「rsdmx」の問題のように見えますか?もしそうなら、誰かが同様の構造を正しく解析する方法を見つけましたか?
r - Eurostat Bulk SDMX データを R にダウンロードしますか?
Eurostat から大量のデータをダウンロードしようとして問題が発生しました。助けていただければ幸いです。この投稿からコードを基にしました。
この警告を受け取りましたが、データフレームは空です:
python - Eurostat SDMX データフローの説明 python
Python を使用して、Eurostat から可能なすべてのデータフローのリストを収集したいと考えています。次のコードがあります。
これにより、考えられるすべての resource_id のリストが得られますが、記述子も必要です。これは可能ですか?
ありがとう
r - R で XML を読み取るときにエンコーディングが失われる
XML
R パッケージを使用してオンライン XML データを取得しています。私の問題は、への呼び出し中に UTF-8 エンコーディングが失われることxmlToList
です。たとえば、「é」は「é」に置き換えられます。これは、XML の解析中に発生します。
以下はコード スニペットです。エンコーディングが失われた例と、エンコーディングが保持されている例 (データ ソースによって異なります) があります。
エンコーディングに関する動作が異なるのはなぜですか? .encoding = "UTF-8"
、getURL
、に設定しようとしましenc2utf8(res)
たが、変更はありません。
どんな助けでも大歓迎です!
ありがとう、
ジェレミー
r - 奇妙なフォーマッター CSV ファイルの読み取り
私は、statistics.gov.scot Web サイトからいくつかのデータをダウンロードしようとしています。たとえば、入院率に関するデータを入手したいと思います。関心のあるデータ テーブルを取得するためのクエリの形式は次のとおりです。
試してみたい人は、このリンクからアクセスできます。クエリ*.CSV
は関連情報を含むファイルを生成しますが、ファイルの形式にはいくつかの課題があります。
ファイル例
ファイルの内容は次のようになります。
Excel にインポートする場合:
ただし、経由でRにインポートするread.csv
と、次のようになります。
問題
read.csv
インポートは 2 つの列のみを返します。問題は、最初の列の一部が空であることに関連していると推測しています。このファイルを、Excel で図解されたインポートと同様の方法で読みたいと考えています。ポイントは、列Aと列Bで行7の値を使用するつもりであり、当然、以下のデータ テーブルを使用することです。を生成するという点では、空のセルがある場合に値を含めたいと思いますが、Excel の値と同等の次元になります。私は試した:data.frame
NA
しかし、私は同じ問題に到達し続けます。
望ましい結果
望ましい結果は次のようになります(手動で生成された抜粋)。
スクリーンショット
さらに説明するために、ディメンションを維持し、欠損値にNA
sを入力します。