問題タブ [delta-lake]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

563 問題

0 投票する

2 に答える

1949 参照

google-cloud-storage - Google Cloud Storage を Delta Lake のストレージレイヤーとして使用するにはどうすればよいですか?

Google Cloud Storage を Delta Lake のストレージレイヤーとして使用できますか?

たるみで見つかりました。

google-cloud-storage delta-lake

2020-01-04T14:24:13.050

0 投票する

0 に答える

96 参照

apache-spark - Databricks デルタファイルから挿入/追加のみをストリームアウトまたは抽出する方法は?

Spark Structured Streaming ジョブを実行して Databricks Delta ソースファイルを読み取り、ソースファイルへの挿入のみを抽出するシナリオがあります。更新/削除を除外したい。

小さいファイルをフォローしようとしましたが、コードが期待どおりに動作しないようです。

2020-01-11T02:34:38.487

0 投票する

1 に答える

1327 参照

apache-spark - デルタレイクの書き込み時に (partitionBy を使用して) パーティションを使用しても効果がない

最初にデルタレイクを作成するときは、パーティションを (partitionBy を使用して) 使用するかどうかにかかわらず、違いはありません。

書き込み前に同じ列で再パーティションを使用すると、寄木細工ファイルの数のみが変更されます。パーティション化する列を明示的に「null 不可」にしても、効果は変わりません。

バージョン:

Spark 2.4 (実際には 2.4.0.0-mapr-620)
スカラ 2.11.12
デルタレイク 0.5.0 (io.delta:delta-core_2.11:jar:0.5.0)

結果の delta-lake ディレクトリは次のようになります。

私は次のようなものを期待します

apache-spark apache-spark-sql partitioning mapr delta-lake

2020-01-15T08:13:58.903

1 2 3 4 5 6 7 8 9 10

問題タブ [delta-lake]

google-cloud-storage - Google Cloud Storage を Delta Lake のストレージ レイヤーとして使用するにはどうすればよいですか?

apache-spark - Databricks デルタ ファイルから挿入/追加のみをストリームアウトまたは抽出する方法は?

apache-spark - デルタ レイクの書き込み時に (partitionBy を使用して) パーティションを使用しても効果がない

Reference

google-cloud-storage - Google Cloud Storage を Delta Lake のストレージレイヤーとして使用するにはどうすればよいですか?

apache-spark - Databricks デルタファイルから挿入/追加のみをストリームアウトまたは抽出する方法は?

apache-spark - デルタレイクの書き込み時に (partitionBy を使用して) パーティションを使用しても効果がない