2

キーに基づいてデータのパーティション分割を開始するユース ケースがあります。キーに属するすべてのデータは、1 つのパーティションに残ります。例えば

キー 1 -> パーティション 1 キー 2 -> パーティション 2

しばらくすると、key1 と key2 をマージする必要があるかもしれません。したがって、すべてのデータを key2 から key1 に、つまり partition2 から partition1 に転送したいだけです。Apache Sparkで可能ですか?費用がかかるため、すべてを再分割したくありません。

4

0 に答える 0