問題タブ [apache-hudi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
24 参照

amazon-emr - EMR の HudiDeltastreamer がデータを Glue に同期しない

ハイブ メタストアとしてグルーを使用して EMR を起動しています。また、データを Hive メタストアに同期するために hive-sync を有効にしました。私の仮定では、これは Glue カタログにテーブルを作成する必要があります。しかし、Apache livy を使用して、livy ユーザーでジョブを送信する REST API からジョブを送信しています。livy ユーザーを使用しているため、変更を加える必要があるかどうかはわかりません。

何か不足している場合はお知らせください。

0 投票する
1 に答える
305 参照

delta-lake - lakeFS、Hudi、Delta Lake のマージとマージの競合

私は lakeFS に関するドキュメントを読んでいますが、現在、lakeFS に関してマージまたはマージの競合とは何かを明確に理解していません。

単一のテーブルで ACID をサポートするために Apache Hudi を使用しているとします。マルチテーブル ACID サポートを導入したいと思います。この目的のために、lakeFS を Hudi と一緒に使用したいと考えています。

すべてを正しく理解していれば、lakeFS はデータにとらわれないソリューションであり、データ自体については何も知りません。lakeFS は境界 (バージョン管理) を確立するだけで、何らかの方法でデータへの同時アクセスを緩和します..

したがって、妥当な質問は、lakeFS がデータに依存しない場合、マージ操作をどのようにサポートするかということです。lakeFSに関して、マージ自体は何を意味しますか? そこでマージの競合が発生する可能性はありますか?