問題タブ [apache-hudi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - sourceOrderingField と hoodie.datasource.write.precombine.field の違いは何ですか?
source-ordering-field
hoodie.datasource.write.precombine.field
hudi config経由で設定しながら、spark-submitのパラメータとして。それらは同じ構成を参照していますか?これらの値が異なる場合はどうなりますか?
amazon-web-services - AWS Glue - s3 バケットに最新のファイルを 1 つだけ出力する方法
AWS Glue と Apache Hudi を使用して、RDS のデータを S3 にレプリケートします。以下のジョブを実行すると、2 つの parquet ファイル (初期のものと更新されたもの) が S3 バケット (basePath) に生成されます。この場合、最新のファイルが 1 つだけ必要で、古いファイルを削除したいと考えています。
バケットに最新のファイルを 1 つ保持する方法を知っている人はいますか?
scala - hoodie.datasource.hive_sync.mode 設定について明確にする必要があります
Hudi には、 、、などの可能な値を持つ構成があります。誰かがこれらの値が何であり、どのように機能するかを説明できますか? とは? をどのように置き換えることができますか? (私の意見では、それらは異なるテクノロジーです)hoodie.datasource.hive_sync.mode
hms
jdbc
hiveql
hms
hiveql
jdbc