問題タブ [google-refine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - jython /pythonElementTreeを使用してGoogleRefineでxmlを解析するにはどうすればよいですか
JythonとElementTreeを使用してGoogleRefineでいくつかのxmlを解析しようとしていますが、これを機能させるのに役立つドキュメントを見つけるのに苦労しています(おそらく、Pythonコーダーでないことで助けられません)
これが私が解析しようとしているXMLの抜粋です。私はすべての結合された文字列を返そうとしていますdc:indentifier
:
これが私がこれまでに持っているコードです。これは、今私が得ているのは「エラー:null」だけなので、何かを返すためのテストです。
java - スクリプト駆動型のGoogleの自動化は、ruby pythonperljavaなどを使用して改良します
バックグラウンド:
同僚のAdamはGoogleRefineを使用してデータベースのダウンロードを処理しており、昨年かそこらで多くの成功を収めていますが、Adamは新しい求人を受け取り、その結果、GoogleRefineで行ったすべての作業と専門知識が失われます。
ベンは、アダムにGoogleリファインで行ったすべての作業をパッケージ化してもらい、オフィスのユーザーがGoogleリファイン自体の使用方法を知らなくても彼の作業から利益を得ることができるようにしたいと考えています。(つまり、入力ファイルを引数として指定するバッチプロセスの一部として実行すると、結果として「洗練された」出力が得られます)。
質問:
ユーザーが指定するだけでよいGoogleリファインのハンズフリーバッチ処理を使用した経験のある人はいますか?1)入力ファイル。および2)変換設定ファイル(またはGoogleリファインの変換ルール)?
質問:
これが利用できない場合、Googleの改良で可能なことに近い何かを達成できる同じまたは類似のツールがそこにあります。
python - Google Refine から外部の *python* 関数を呼び出すことはできますか?
私はデータ作業の一部を高速化するために Google の改良を調査しています。今週まで使用したことがありませんでしたが、私が見たものの多くは気に入っています。
これまでの私の最大の疑問は、Refine から外部の Python 関数を呼び出すことができるかどうかです。内部でjythonを呼び出すことができることは知っていますが、それではCベースのpythonライブラリ(lxmlなど)へのアクセスが提供されません。また、多くのコピーアンドペーストや書き直しの手間をかけずに、統合したいスクリプトが他の場所にあります。
Refine でこれを行うにはどのようなオプションがありますか? 私は創造性を発揮したいと思っています。安定した再利用可能なソリューションが欲しいだけです。
json - Googleが大規模なデータセットのフリーベースからデータを絞り込んでフェッチし、URLから列を作成しても機能しない
36k行のデータを含むgooglerefineプロジェクトがあります。freebaseurlからjsonデータをフェッチする別の列を追加したいと思います。小さなデータセットで動作させることができましたが、このプロジェクトで実行すると、処理に数時間かかり、ほとんどの結果が空白になりました。しかし、私はデータでいくつかの結果を得ました。データがフェッチされる行数を制限する方法、またはURLからデータを取得するためのより良い方法はありますか?
ありがとう!
crud - 行番号と列番号で値を取得する
カスタムテキストファセットで、前の行のセルの値を確認したいと思います。
結果なしで試しrows[row.index - 1]
ました。
json - GoogleRefineでJSONを解析する
Google Refineを使用して、DataScienceToolkitのcoordinates2politicsAPIの結果から特定の要素を抽出しようとしています。
これがサンプルセル#1です。
このGREL構文を使用してこの列に基づく列を追加し、郡のDaneを引き出しました。
しかし、サンプルセル#2に到達すると、JSONの結果が少し異なるため、構文が機能しなくなりました。
どちらの場合でも郡を見つけることができるように、JSONを並べ替えたり、構文を表現したりする方法はありますか?
アップデート
これが、位置だけでなく名前でJSON文字列内の要素を検索できるようにする魔法のGRELです。
google-refine - すでに「ファセット」されているテーブルをサブファセットする方法はありますか?
(列で) 重複を見つけるために、カスタマイズされたファセットを適用しているテーブルがあります。ここで、ファセットを持つテーブルに (別の列に) 新しいファセットを適用したいと思います。
それは可能ですか?一度に使用できるのは 1 つのファセットのみであり、組み合わせて使用することはできないようです。
乾杯、
エリサ
google-refine - Cell.cross() は Google Refine プロジェクトでエラーを返します
メイン プロジェクトの Date 列に基づいて、別の Google Refine プロジェクトからタイムライン イベントを取得する新しい列を作成しようとしています。
cell.cross("Clean5 タイムライン", "TimelineDate").cells["TimelineEvent"].value[0]
日付は両方の Google Refine プロジェクトで同じ形式です。しかし、それはセルを埋めず、次のエラーが発生します:
エラー: null からフィールドを取得できません
この — cell.cross("Clean5 Timeline", "TimelineDate") — は、一致するはずの行に対して [ ] を返します。
そして、この cell.cross("Clean5 Timeline", "TimelineDate").cells["TimelineEvent"] は、それらの行に対して null を返します。
GREL ヘルプ ファイルから構文を直接コピーしました: http://code.google.com/p/google-refine/wiki/GRELOtherFunctions。私が見落としている可能性のあるものを誰かが提案できますか?
ありがとう。
entity - 2 つのデータベース内の乱雑なエンティティを調整するための Google Refine レシピ
次のような厄介な名前のデータベースが 2 つあります。
- ボビー・ジンダル
- フロリダ州知事 ボビー・ジンダル
- ボビー・ジンダル
- スリーエム株式会社
- 3Mメノモニー
一致するものを見つける必要があります。Google Refineでこれを行う方法について、誰かが私に指摘したり、良いレシピを提案したりできますか?
このリンクは私に出発点を与えてくれますが、さらにアドバイスを使用できます: http://blog.ouseful.info/2011/05/06/merging-datesets-with-common-columns-in-google-refine/
regex - Google Refine: 正規表現が機能しない
Google Refine でテキスト ファサードの正規表現を照合する必要があります。式を試してみましたが、うまくいきませんでした。次に、www.lenovo.com で文字列 lenovo を一致させる簡単なケースを試しました。
一部の行では、私の値は値を取りwww.lenovo.com
、
このような単純な文字列の一致が、Google の絞り込みで機能しないのはなぜですか。私はWindowsで実行しています。
明らかな構文エラーがある場合はお知らせください。