問題タブ [google-refine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2039 参照

python - jython /pythonElementTreeを使用してGoogleRefineでxmlを解析するにはどうすればよいですか

JythonとElementTreeを使用してGoogleRefineでいくつかのxmlを解析しようとしていますが、これを機能させるのに役立つドキュメントを見つけるのに苦労しています(おそらく、Pythonコーダーでないことで助けられません)

これが私が解析しようとしているXMLの抜粋です。私はすべての結合された文字列を返そうとしていますdc:indentifier

これが私がこれまでに持っているコードです。これは、今私が得ているのは「エラー:null」だけなので、何かを返すためのテストです。

0 投票する
1 に答える
1559 参照

java - スクリプト駆動型のGoogleの自動化は、ruby pythonperljavaなどを使用して改良します

バックグラウンド:

同僚のAdamはGoogleRefineを使用してデータベースのダウンロードを処理しており、昨年かそこらで多くの成功を収めていますが、Adamは新しい求人を受け取り、その結果、GoogleRefineで行ったすべての作業と専門知識が失われます。

ベンは、アダムにGoogleリファインで行ったすべての作業をパッケージ化してもらい、オフィスのユーザーがGoogleリファイン自体の使用方法を知らなくても彼の作業から利益を得ることができるようにしたいと考えています。(つまり、入力ファイルを引数として指定するバッチプロセスの一部として実行すると、結果として「洗練された」出力が得られます)。

質問:

ユーザーが指定するだけでよいGoogleリファインのハンズフリーバッチ処理を使用した経験のある人はいますか?1)入力ファイル。および2)変換設定ファイル(またはGoogleリファインの変換ルール)?

質問:

これが利用できない場合、Googleの改良で可能なことに近い何かを達成できる同じまたは類似のツールがそこにあります。

0 投票する
2 に答える
503 参照

python - Google Refine から外部の *python* 関数を呼び出すことはできますか?

私はデータ作業の一部を高速化するために Google の改良を調査しています。今週まで使用したことがありませんでしたが、私が見たものの多くは気に入っています。

これまでの私の最大の疑問は、Refine から外部の Python 関数を呼び出すことができるかどうかです。内部でjythonを呼び出すことができることは知っていますが、それではCベースのpythonライブラリ(lxmlなど)へのアクセスが提供されません。また、多くのコピーアンドペーストや書き直しの手間をかけずに、統合したいスクリプトが他の場所にあります。

Refine でこれを行うにはどのようなオプションがありますか? 私は創造性を発揮したいと思っています。安定した再利用可能なソリューションが欲しいだけです。

0 投票する
1 に答える
500 参照

json - Googleが大規模なデータセットのフリーベースからデータを絞り込んでフェッチし、URLから列を作成しても機能しない

36k行のデータを含むgooglerefineプロジェクトがあります。freebaseurlからjsonデータをフェッチする別の列を追加したいと思います。小さなデータセットで動作させることができましたが、このプロジェクトで実行すると、処理に数時間かかり、ほとんどの結果が空白になりました。しかし、私はデータでいくつかの結果を得ました。データがフェッチされる行数を制限する方法、またはURLからデータを取得するためのより良い方法はありますか?

ありがとう!

0 投票する
1 に答える
767 参照

crud - 行番号と列番号で値を取得する

カスタムテキストファセットで、前の行のセルの値を確認したいと思います。

結果なしで試しrows[row.index - 1]ました。

0 投票する
1 に答える
4620 参照

json - GoogleRefineでJSONを解析する

Google Refineを使用して、DataScienceToolkitのcoordinates2politicsAPIの結果から特定の要素を抽出しようとしています。

これがサンプルセル#1です。

このGREL構文を使用してこの列に基づく列を追加し、郡のDaneを引き出しました。

しかし、サンプルセル#2に到達すると、JSONの結果が少し異なるため、構文が機能しなくなりました。

どちらの場合でも郡を見つけることができるように、JSONを並べ替えたり、構文を表現したりする方法はありますか?

アップデート

これが、位置だけでなく名前でJSON文字列内の要素を検索できるようにする魔法のGRELです。

0 投票する
1 に答える
79 参照

google-refine - すでに「ファセット」されているテーブルをサブファセットする方法はありますか?

(列で) 重複を見つけるために、カスタマイズされたファセットを適用しているテーブルがあります。ここで、ファセットを持つテーブルに (別の列に) 新しいファセットを適用したいと思います。

それは可能ですか?一度に使用できるのは 1 つのファセットのみであり、組み合わせて使用​​することはできないようです。

乾杯、

エリサ

0 投票する
1 に答える
1371 参照

google-refine - Cell.cross() は Google Refine プロジェクトでエラーを返します

メイン プロジェクトの Date 列に基づいて、別の Google Refine プロジェクトからタイムライン イベントを取得する新しい列を作成しようとしています。

cell.cross("Clean5 タイムライン", "TimelineDate").cells["TimelineEvent"].value[0]

日付は両方の Google Refine プロジェクトで同じ形式です。しかし、それはセルを埋めず、次のエラーが発生します:

エラー: null からフィールドを取得できません

この — cell.cross("Clean5 Timeline", "TimelineDate") — は、一致するはずの行に対して [ ] を返します。

そして、この cell.cross("Clean5 Timeline", "TimelineDate").cells["TimelineEvent"] は、それらの行に対して null を返します。

GREL ヘルプ ファイルから構文を直接コピーしました: http://code.google.com/p/google-refine/wiki/GRELOtherFunctions。私が見落としている可能性のあるものを誰かが提案できますか?

ありがとう。

0 投票する
2 に答える
793 参照

entity - 2 つのデータベース内の乱雑なエンティティを調整するための Google Refine レシピ

次のような厄介な名前のデータベースが 2 つあります。

  • ボビー・ジンダル
  • フロリダ州知事 ボビー・ジンダル
  • ボビー・ジンダル
  • スリーエム株式会社
  • 3Mメノモニー

一致するものを見つける必要があります。Google Refineでこれを行う方法について、誰かが私に指摘したり、良いレシピを提案したりできますか?

このリンクは私に出発点を与えてくれますが、さらにアドバイスを使用できます: http://blog.ouseful.info/2011/05/06/merging-datesets-with-common-columns-in-google-refine/

0 投票する
2 に答える
1352 参照

regex - Google Refine: 正規表現が機能しない

Google Refine でテキスト ファサードの正規表現を照合する必要があります。式を試してみましたが、うまくいきませんでした。次に、www.lenovo.com で文字列 lenovo を一致させる簡単なケースを試しました。

一部の行では、私の値は値を取りwww.lenovo.com

このような単純な文字列の一致が、Google の絞り込みで機能しないのはなぜですか。私はWindowsで実行しています。

明らかな構文エラーがある場合はお知らせください。