Google Cloud Datastore から Bigquery へのデータ転送に問題があります。このジョブのために Python でデータフロー スクリプトを作成する必要があります。このジョブは、Python でパイプラインを使用してデータストアから BigQuery にデータを転送する必要があります。Python でこのジョブを実行するには、「Apache Beam」ライブラリが必要ですが、Apache Beam ライブラリが機能していません。誰でも私たちを助けることができますか?
1 に答える
1
Google Cloud Dataflow SDK for Python はすぐに使用でき、現時点では Google Cloud Platform でベータ レベルのサポートが提供されています。これは、Apache Beam コードベースに基づいています。この SDK の使用を開始するには、クイックスタートに従ってください。特定のエラーが表示された場合は、別の質問をして、特定の問題を引用してください。
とはいえ、SDK for Python はまだ Google Cloud Datastore に直接アクセスするための API を提供していません。ジェネリックSource
とSink
API を使用して作成できます。これは難しいことではありませんが、簡単なことでもありません。これは私たちが積極的に取り組んでいるものであり、近い将来、Python SDK にこの API が含まれる予定です。
DatastoreIO
当面は、BigqueryIO
APIを含むこのタスク用の SDK for Java を試してみることをお勧めします。
于 2016-10-07T22:35:49.990 に答える