問題タブ [google-cloud-dataprep]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
739 参照

google-cloud-platform - Dataprep を使用して日付分割テーブルの日付パーティションのみに書き込む

BigQuery ビューを使用して BigQuery テーブルから昨日のデータを取得し、Dataprep を使用して日付分割テーブルに書き込もうとしています。

私の最初の問題は、Dataprep がDATE型列を正しく取得できず、それらをTIMESTAMP機能するように変換することでした (Elliot に感謝)。

ただし、Dataprep を使用して出力 BigQuery テーブルを設定する場合、次の 3 つのオプションしかありません: AppendTruncateまたはDrop既存のテーブル。テーブルが日付パーティション分割されている場合、Truncateそれを使用すると、そのパーティション内のデータだけでなく、既存のすべてのデータが削除されます。

私が使用すべき別の方法はありますか?別の方法として、Dataprep を使用してテーブルを上書きしてから、Cloud Composer を使用して SQL を実行し、このデータを日付分割テーブルにプッシュします。理想的には、Dataprep だけでこれを行いたいのですが、今のところそれは不可能のようです。

BigQuery テーブル スキーマ:

ここに画像の説明を入力

パーティションの詳細:

ここに画像の説明を入力

取り込んでいるデータは単純です。1 つのフロー:

他のフローでは:

どちらの場合もデータを上書きします。