問題タブ [apache-hudi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
50 参照

java - sourceOrderingField と hoodie.datasource.write.precombine.field の違いは何ですか?

source-ordering-fieldhoodie.datasource.write.precombine.fieldhudi config経由で設定しながら、spark-submitのパラメータとして。それらは同じ構成を参照していますか?これらの値が異なる場合はどうなりますか?

0 投票する
1 に答える
124 参照

amazon-web-services - AWS Glue - s3 バケットに最新のファイルを 1 つだけ出力する方法

AWS Glue と Apache Hudi を使用して、RDS のデータを S3 にレプリケートします。以下のジョブを実行すると、2 つの parquet ファイル (初期のものと更新されたもの) が S3 バケット (basePath) に生成されます。この場合、最新のファイルが 1 つだけ必要で、古いファイルを削除したいと考えています。

バケットに最新のファイルを 1 つ保持する方法を知っている人はいますか?

0 投票する
0 に答える
26 参照

scala - hoodie.datasource.hive_sync.mode 設定について明確にする必要があります

Hudi には、 、、などの可能な値を持つ構成があります。誰かがこれらの値が何であり、どのように機能するかを説明できますか? とは? をどのように置き換えることができますか? (私の意見では、それらは異なるテクノロジーです)hoodie.datasource.hive_sync.modehmsjdbchiveqlhmshiveqljdbc