2

私はデータ作業の一部を高速化するために Google の改良を調査しています。今週まで使用したことがありませんでしたが、私が見たものの多くは気に入っています。

これまでの私の最大の疑問は、Refine から外部の Python 関数を呼び出すことができるかどうかです。内部でjythonを呼び出すことができることは知っていますが、それではCベースのpythonライブラリ(lxmlなど)へのアクセスが提供されません。また、多くのコピーアンドペーストや書き直しの手間をかけずに、統合したいスクリプトが他の場所にあります。

Refine でこれを行うにはどのようなオプションがありますか? 私は創造性を発揮したいと思っています。安定した再利用可能なソリューションが欲しいだけです。

4

2 に答える 2

2

Google Refine Wikiが言うように:

lxml には CPython (通常の Python) 用の C バインディングがあるため、lxml は Jython では機能しません。したがって、Jython / Java のみであり、CPython インタープリターが組み込まれていない Refine では機能しません。

ただし、Google Refine Python クライアント ライブラリを試して、プロジェクトを作成し、プログラムでデータを操作することはできます。

于 2012-02-02T18:16:06.820 に答える
1

reclosedevの回答を承認済みとしてマークしますが、話にはまだまだ少しあります。

この質問に対するもう1つの答えは、独自のPythonベースのAPIを設定できることです。このプロジェクトでは、ローカルサーバーで実行されるdjangoアプリをセットアップすることができました。既存のライブラリにAPIを構築するのに1時間ほどしかかかりませんでした。

私が思っていたよりも面倒ですが、あまり時間をかけずにこのプロジェクトの法案に適合します。

于 2012-02-03T14:20:03.017 に答える