0

Google Cloud Datastore から Bigquery へのデータ転送に問題があります。このジョブのために Python でデータフロー スクリプトを作成する必要があります。このジョブは、Python でパイプラインを使用してデータストアから BigQuery にデータを転送する必要があります。Python でこのジョブを実行するには、「Apache Beam」ライブラリが必要ですが、Apache Beam ライブラリが機能していません。誰でも私たちを助けることができますか?

4

1 に答える 1

1

Google Cloud Dataflow SDK for Python はすぐに使用でき、現時点では Google Cloud Platform でベータ レベルのサポートが提供されています。これは、Apache Beam コードベースに基づいています。この SDK の使用を開始するには、クイックスタートに従ってください。特定のエラーが表示された場合は、別の質問をして、特定の問題を引用してください。

とはいえ、SDK for Python はまだ Google Cloud Datastore に直接アクセスするための API を提供していません。ジェネリックSourceSinkAPI を使用して作成できます。これは難しいことではありませんが、簡単なことでもありません。これは私たちが積極的に取り組んでいるものであり、近い将来、Python SDK にこの API が含まれる予定です。

DatastoreIO当面は、BigqueryIOAPIを含むこのタスク用の SDK for Java を試してみることをお勧めします。

于 2016-10-07T22:35:49.990 に答える