問題タブ [opendata]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
241 参照

csv - awk は $NF.... をいくつかの入力ファイルで上書きします

いくつかのアドレスと管理者コードを含む .csv ファイルがあります。最後の列(英国の郵便番号)で並べ替えたい。最後の列を最初に移動してから を使用してファイルを並べ替えようとしていますがsort、奇妙な問題が発生しています。データの一部を次に示します。

最後の列を取得できます。

しかし、行に何か他のものを印刷すると、上書きされます。

明らかに役に立たない。編集したばかりのテスト ファイルを使用してみましたが、この動作が見られないため、この特定のファイルに関係があります。助言がありますか?一部の改行文字に関する既知の問題はありますか? 私は Mac で作業していますが、ファイルは PC からのものであると思われます。イギリスのNHSのデータです。

0 投票する
1 に答える
717 参照

rdf - トリプル RDF の複製

質問があります。

ファイル RDF 内の重複したトリプルを削除したいと考えています。たとえば、次の 2 つのトリプルの RDF グループがあります。

トリプル1=

  • rdf:説明 rdf:about="http://Group/row1"
    • vocab:regione カンパニア語 /vocab:regione
    • vocab:nome ナポリ /vocab:nome
    • 語彙:コード NA /語彙:コード
  • /rdf:説明

ここで、vocab:regione、vocab:nome、vocab:codice は述語です。

トリプル2=

  • rdf:説明 rdf:about="http://Group/row1"
    • vocab:nome ナポリ /vocab:nome
    • 語彙:コード NA /語彙:コード
  • /rdf:説明

vocab:nome と vocab:codice は述語です。

この場合、「Triple1」には「Triple2」が含まれます。「Triple2」は削除する必要がありますか?

前もって感謝します。

0 投票する
1 に答える
132 参照

data-cleaning - openrefine フラグが行を変更しました

openrefine を使用して Excel データセットをクリーンアップしています。私は約 70 の操作を行っており、さまざまなデータ セットでカット アンド ペーストを行ってきました。レコード ID を維持し、新しい Excel シートにエクスポートします。次に、レコード ID を使用してシートをリロードします。

それはうまく機能しますが、ほんの一握りのレコードが変更されただけでも、データベース全体をリロードする必要があります。変更されたレコードにフラグを付けて、変更されたレコードのみをアプリケーションにエクスポート/インポートする簡単な方法はありますか?

70 の操作にフラグを簡単に追加して、変更されたレコードのみにタグを付けることができますか?

0 投票する
0 に答える
304 参照

google-maps-api-3 - kml オープン データ ファイルは Google Earth では表示されますが、Google マップ API アプリケーションでは表示されません。

フランスの都市のオープンデータ Web サイトから kml ファイルをダウンロードしました (この kml ファイルは Google Earth で正しく表示されます) が、Google Map API のアプリケーションで表示できません (オブジェクト「google.maps を使用します」 .KmlLayer" は、自分の kml ファイルで問題なく動作します)

ダウンロードしたファイルはこちら

http://www.paysagesdefrance/kml/theatre.kml

理由がわかりますか?私の問題を解決する解決策はありますか?

0 投票する
1 に答える
478 参照

exception - ckanext-archiver のインストール時に celery という名前のモジュールがありません

私はオープン データ ポータルとして CKAN を使用しており、https://github.com/ckan/ckanext-archiverの指示に従ってアーカイバ拡張機能をインストールしようとしています。ただし、ckan 構成ファイルでアーカイバを有効にした後、解決できなかったこのエラーに直面しています。

アクティブ化された virtualenv と必要なライブラリから拡張機能をインストールしました。

誰かがこれを修正する方法を知っている場合は感謝します。ありがとう。

0 投票する
1 に答える
776 参照

rdf - JENA と SPARQL を使用して、場所の名前を持つ Geonames から場所 (都市、州、国) の情報を取得するにはどうすればよいですか?

Geonames データベースへの SPARQL クエリを使用して、場所の情報、つまり人口を見つけるのを手伝ってくれる人はいますか? 地名しかない。ジェナを使用しています。

0 投票する
1 に答える
370 参照

opendata - OpenData エンドポイントのリストを照会する方法

Socrata を使用して、OpenData サイトによって提供されるエンドポイントのリストを取得するクエリはどのようにできますか?

0 投票する
1 に答える
921 参照

r - Rで可能なすべてのペアの頻度を見つける

私は R を使用して薬物と反応の大規模なデータセットを扱っています。今のところ、レポート ID 番号、薬物名、および報告された反応をリストする非常に長いデータ フレームとして構造化されたデータがあります。おわかりのように、ID と薬物、および薬物と反応の間には 1 対多の関係があります。

このデータセットは、ここで複製できるものよりもはるかに大きいことを念頭に置いて、どの薬物の組み合わせがどの反応をどの頻度でもたらすかを見つける方法を知りたい.

最も重要なことは、このような問題にどのようにアプローチするかに興味があるということです。データは正しく構造化されていますか? どのような概念やライブラリについて読む必要がありますか?

実際のデータへのリンクは次のとおりです: https://www.dropbox.com/s/kzx4mpyytbo9zil/query_result.csv

私の小さな小さな脳では、最終結果は次のようになります...

Drug1 と Drug2 は、データセット全体で最も頻度の高い薬物ペアです。「薬物ペア」は、同じレポート ID を持つ 2 つの薬物の任意の組み合わせとして定義されます。上記の出力例は、「行 1 には 298 の一意のレポート ID があり、その反応が肝不全であった」と解釈されます。

0 投票する
2 に答える
5676 参照

xml - xml を json に変換してファイルを Bigquery に処理する

stackexchange の生データを BigQuery に処理したいのですが、最初にデータが 7z 圧縮形式を使用しているため、データを解凍して gz 形式に移植しましたが、内部ファイルは xml です。したがって、ファイルをxmlからjsonに変換する必要があります。何か案は?p7zip を使用して解凍し、xml2json を使用して xml ファイルを移植しようとしましたが、機能しませんでした。

xml2json xml2json -t json2xml -o xxx.xml yyy.json を使用しました

xml-json を使用したその他のテスト **David の推奨事項

このコマンドで、stackoverflow.com-Users.7z のこのファイル Users.xml (サイズ 895M) を使用しました: xml-json Users.xml 行 > Users.json