問題タブ [openrefine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
openrefine - Google Refine で複数の列をファセットする方法
30 列と複数行のデータ セットがあります (一部のセルにはデータがありません)。グループ内の列をファセットできるようにしたいと思います。
上記のデータを考えると、ファセットが列のグループ内のインスタンスの数を返すようにしたいと思います。最初の 3 つの列では、次のファセットを返す必要があります。
データをロードしたときに列を結合しようとしましたが、個々のデータもグループ化されました。これは望ましい結果ではありません。例えば:
前もって感謝します。
json - Google Refine: JSON 辞書を反復処理する
Google Refine 内に JSON があります - http://mapit.mysociety.org/point/4326/0.1293497,51.5464828フルバージョン用ですが、省略形は次のようになります:
(一意であると推定される) type を持つオブジェクトの名前のみを抽出したいWMC
。
Google Refine での JSON の解析は役に立ちません。これは辞書ではなく配列で動作します。
これを修正するために私が見なければならない提案はありますか?
編集:初期キーが何であるかはわかりません。それらは、事前に予測できない一意の識別子であると思います。
freebase - Google-Freebaseから列を調整/追加:制約が機能していないようです
Freebaseと調整したTownsの列があります。次に、人口を含むFreebaseから新しい列を作成します。制約付きの「人口»番号」列を追加します
{"year>": "2006"、 "year <": "2012"、 "sort": "-year"、 "limit":1}
最新の番号を取得するには(http://code.google.com/p/google-refine/issues/detail?id=92#c5を参照)。その代わりに、制約が考慮されていないかのように10個の数値を取得します。誰かが助けることができますか?
ありがとうございました
data-cleaning - Googleは行と列の間の相互参照を改良します
これがGoogleRefineで実現できるかどうかはわかりません。でも基本的にはこういうデータがあります。
最初のテーブルは、すべてのユーザーのテーブルです。2番目の表は、すべての友達を示しています。ただし、"friends"
列の2番目のテーブルでは、削除したい最初のテーブルにすべてのIDが存在するわけではありません。では、2番目のテーブルの列の各IDを検索friends
して、テーブル1に存在しないIDを削除するにはどうすればよいですか?
openrefine - OpenRefine正規表現でグループを使用する
OpenRefineGREL構文で使用されるReGeXで「グループ」を使用できるかどうか疑問に思っています。つまり、文字の後に続くすべてのドットを同じ文字とドットで置き換えたいのですが、その後にスペースと文字が続きます。
何かのようなもの:
clojure - clojureまたはjythonで日付をエポック時間に変換する
OpenRefine で日付をエポック時間に変換する式を探しています。GREL 言語がこれをサポートしていないことは知っていますが、clojure や jython がサポートしているのではないかと思います。
私はそれらの言語にまったく精通していません。
今のところ、このサービスでAPI 呼び出しを使用していますが、これは大きなデータ セットを使用する長いプロセスです。
ありがとう
json - OpenRefineの列へのセル
JSONに変換したいCSVのデータセットがあります。変換する前に、適切な多次元構造を取得するためにデータを再フォーマットする必要があります。データには、スウェーデンでの前回の選挙の結果が含まれており、郡(「Kommun」)で分割されています。291の郡と9つの党があります。が欲しいです:
- 郡ごとに1行、
- 各パーティに1つの列があり、各行には各パーティの結果が表示されます。
これにより、10列(郡+パーティ)と291行(郡ごとに1つ)になります。
Open Refine / Google Refineを使用してこれを達成するにはどうすればよいですか?私の現在のデータは下の画像に示されています。
jython - OpenRefineは、jythonを使用してリストから重複を削除します
値が重複している列があります。
重複を削除するjythonを使用して変換を適用しています(エラー時にオリジナルを保持するように設定されています)。コードは次のとおりです。
プレビューでは機能しますが、列には適用されません。私は何を間違っていますか?
openrefine - Google Refine:類似しているが異なる列の2つのデータセットをマージしますか?
2つのデータセットがあり、共通の列名がわずかに異なります。
データセットA:
データセットB:
Google Refine / Open Refineは、この種の厄介なデータをあいまいな方法で調整するのに役立つように設計されていると思いましたが、そうではないようです。
コードを記述せずに、これらをあいまいに一致させるために使用できるツールはありますか?必要に応じて簡単にコードを書くことができますが、GoogleRefineが私がやったことをやっているように見えないことに驚いています。
csv - Google Refine の列にセルのペアを 1 つおきに追加する
世界各国の男性と女性の数のデータセットがあります。
国の行のすべてのペアにマージを追加し、性別の列を消去して、次のようにします。
Google/Open Refine でこの方法で行を追加するにはどうすればよいですか?