問題タブ [openrefine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3744 参照

openrefine - Google Refine で複数の列をファセットする方法

30 列と複数行のデータ セットがあります (一部のセルにはデータがありません)。グループ内の列をファセットできるようにしたいと思います。

上記のデータを考えると、ファセットが列のグループ内のインスタンスの数を返すようにしたいと思います。最初の 3 つの列では、次のファセットを返す必要があります。

データをロードしたときに列を結合しようとしましたが、個々のデータもグループ化されました。これは望ましい結果ではありません。例えば:

前もって感謝します。

0 投票する
1 に答える
1000 参照

json - Google Refine: JSON 辞書を反復処理する

Google Refine 内に JSON があります - http://mapit.mysociety.org/point/4326/0.1293497,51.5464828フルバージョン用ですが、省略形は次のようになります:

(一意であると推定される) type を持つオブジェクトの名前のみを抽出したいWMC

Google Refine での JSON の解析は役に立ちません。これは辞書ではなく配列で動作します。

これを修正するために私が見なければならない提案はありますか?


編集:初期キーが何であるかはわかりません。それらは、事前に予測できない一意の識別子であると思います。

0 投票する
1 に答える
229 参照

freebase - Google-Freebaseから列を調整/追加:制約が機能していないようです

Freebaseと調整したTownsの列があります。次に、人口を含むFreebaseから新しい列を作成します。制約付きの「人口»番号」列を追加します

{"year>": "2006"、 "year <": "2012"、 "sort": "-year"、 "limit":1}

最新の番号を取得するには(http://code.google.com/p/google-refine/issues/detail?id=92#c5を参照)。その代わりに、制約が考慮されていないかのように10個の数値を取得します。誰かが助けることができますか?

ありがとうございました

0 投票する
1 に答える
907 参照

data-cleaning - Googleは行と列の間の相互参照を改良します

これがGoogleRefineで実現できるかどうかはわかりません。でも基本的にはこういうデータがあります。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

最初のテーブルは、すべてのユーザーのテーブルです。2番目の表は、すべての友達を示しています。ただし、"friends"列の2番目のテーブルでは、削除したい最初のテーブルにすべてのIDが存在するわけではありません。では、2番目のテーブルの列の各IDを検索friendsして、テーブル1に存在しないIDを削除するにはどうすればよいですか?

0 投票する
2 に答える
686 参照

openrefine - OpenRefine正規表現でグループを使用する

OpenRefineGREL構文で使用されるReGeXで「グループ」を使用できるかどうか疑問に思っています。つまり、文字の後に続くすべてのドットを同じ文字とドットで置き換えたいのですが、その後にスペースと文字が続きます。

何かのようなもの:

0 投票する
5 に答える
1611 参照

clojure - clojureまたはjythonで日付をエポック時間に変換する

OpenRefine で日付をエポック時間に変換する式を探しています。GREL 言語がこれをサポートしていないことは知っていますが、clojure や jython がサポートしているのではないかと思います。

私はそれらの言語にまったく精通していません。

今のところ、このサービスでAPI 呼び出しを使用していますが、これは大きなデータ セットを使用する長いプロセスです。

ありがとう

0 投票する
1 に答える
906 参照

json - OpenRefineの列へのセル

JSONに変換したいCSVのデータセットがあります。変換する前に、適切な多次元構造を取得するためにデータを再フォーマットする必要があります。データには、スウェーデンでの前回の選挙の結果が含まれており、郡(「Kommun」)で分割されています。291の郡と9つの党があります。が欲しいです:

  • 郡ごとに1行、
  • 各パーティに1つの列があり、各行には各パーティの結果が表示されます。

これにより、10列(郡+パーティ)と291行(郡ごとに1つ)になります。

Open Refine / Google Refineを使用してこれを達成するにはどうすればよいですか?私の現在のデータは下の画像に示されています。

絞り込み印刷画面を開く

0 投票する
2 に答える
1010 参照

jython - OpenRefineは、jythonを使用してリストから重複を削除します

値が重複している列があります。

重複を削除するjythonを使用して変換を適用しています(エラー時にオリジナルを保持するように設定されています)。コードは次のとおりです。

プレビューでは機能しますが、列には適用されません。私は何を間違っていますか?

0 投票する
3 に答える
5463 参照

openrefine - Google Refine:類似しているが異なる列の2つのデータセットをマージしますか?

2つのデータセットがあり、共通の列名がわずかに異なります。

データセットA:

データセットB:

Google Refine / Open Refineは、この種の厄介なデータをあいまいな方法で調整するのに役立つように設計されていると思いましたが、そうではないようです。

コードを記述せずに、これらをあいまいに一致させるために使用できるツールはありますか?必要に応じて簡単にコードを書くことができますが、GoogleRefineが私がやったことをやっているように見えないことに驚いています。

0 投票する
1 に答える
129 参照

csv - Google Refine の列にセルのペアを 1 つおきに追加する

世界各国の男性と女性の数のデータセットがあります。

国の行のすべてのペアにマージを追加し、性別の列を消去して、次のようにします。

Google/Open Refine でこの方法で行を追加するにはどうすればよいですか?