[int id,int value] で構成される受信タプルの平均を Storm で計算したいと考えています。ご覧のとおり、フィールドのグループ化を使用してデータを分割することはできません。この計算を分散するにはトポロジ アーキテクチャが必要です。私が考えている唯一の方法は、各ボルト インスタンス内でミニ バッチを実行してから集計することです。
ストーム内でミニバッチ処理を行うには、トライデントが適切なソリューションであることがわかりました。
属性に基づいてデータを分割できない場合に、嵐のような手段、グローバル カウント、std-devs を使用してグローバル分析を計算するためのベスト プラクティスは何ですか? トポロジの例はありますか?