ドキュメント ( http://snappydatainc.github.io/snappydata/streamingWithSQL/ ) を読んで、この項目について質問がありました:
「共同パーティショニングによるシャッフルの削減: SnappyData を使用すると、入力キュー (Kafka ソースなど) で使用されるパーティショニング キー、ストリーム プロセッサ、および基礎となるストアはすべて同じにすることができます。これにより、レコードをシャッフルする必要性が劇的に減少します。」
Kafka を使用していて、キー (単一値) を使用してトピック内のデータを分割する場合。この単一のキーを kafka から、スナッピー テーブルで識別される複数のパーティション キーにマップすることは可能ですか?
複数のキーを単一のキーに変換する何らかのハッシュはありますか?
シャッフルを減らすことの利点は大きいと思われ、ここでベスト プラクティスを理解しようとしています。
ありがとう!