2

CKAN データ プレビュー ツールでデータを適切にプレビューできるようにするために従うべきガイドラインは何ですか? 私は CKAN に取り組んでおり、データをアップロードしたり、外部の Web サイトにリンクしたりしています。うまくプレビューできるものもあれば、そうでないものもあります。私は機械可読性についてオンラインで調査してきましたが、CKAN で適切にプレビューできるようにデータを構造化する正しい方法を述べている CKAN に関連するリソースを見つけることができませんでした。今後、CKAN のパブリッシャーや開発者に役立つように、すべきこととすべきでないことについて皆さんからの回答を集めたいと考えています。

たとえば、データは行と列にラベルが付けられた表形式である必要があります。他のタブはプレビューできないため、データはスプレッドシートの最初のタブに保存する必要があります。スプレッドシートに数式やマクロを含めることはできません。データは正しいファイル形式で保存する必要があります (私の別のトピックを参照してください: CKAN データ プレビュー ツールでプレビューできるファイル形式は? )

ありがとう!

4

3 に答える 3

3

CKAN はオープン ソースのデータ管理システムであるため、データの機械可読性に関する特定のガイドラインはありません。代わりに、データの公開性と機械可読性の現在の標準をここで確認することをお勧めします: http://5stardata.info

英国の CKAN の実装には、5 つ星のオープン データ スキームに基づいてデータのオープン性を評価するのに役立つ一連のプラグインも含まれています: https://github.com/ckan/ckanext-qa

于 2014-06-25T06:54:58.927 に答える
1
  1. データ プッシャー ログを確認する - CKAN データ ストアでファイルをホストすると、データをロードするツールがログを提供します - これらは、データの形式に関する問題を明らかにします。
  2. データをローカルに保存 - 可能であれば、データをローカルに保存します。これは、他の場所に保存されたデータがプロキシ プロセス ( https://github.com/okfn/dataproxy ) を通過する必要があるためです。
  3. ファイル サイズと接続性を考慮する - CKAN データ エクスプローラーへの読み込み時にタイムアウトしないように、インストールと接続性に十分なファイル サイズを維持してください。ファイルが外部でホストされていてサイズが大きく、ファイルへのアクセスが遅い (接続が不十分であるか、負荷が高すぎる) 場合、プロキシはプレビュー用に表示される前にファイル全体を読み取る必要があるため、タイムアウトが発生します。ここでもデータをローカルでホストすることは、コンピューティング リソースの負荷をより適切に制御し、データ エクスプローラーが一貫して動作することを保証することを意味します。
  4. オープン ファイル形式を使用する - CKAN を使用してオープン データを公開している場合、コミュニティは一般に、独自の形式 (XLS など) ではなく、オープン形式 (CSV、TXT など) でデータを公開するのが最善であると考えています。これには、すべてのユーザーがデータにアクセスできるようになるだけでなく、データがプレビュー用に適切に構造化されていない可能性を減らすだけでなく、他の利点もあります。たとえば、意図しない情報を誤って公開することはより困難になります。
  5. データの検証- CSVKITなどのツールを使用して、データが良好な状態であることを確認します。
于 2014-06-25T13:50:36.450 に答える