2

[int id,int value] で構成される受信タプルの平均を Storm で計算したいと考えています。ご覧のとおり、フィールドのグループ化を使用してデータを分割することはできません。この計算を分散するにはトポロジ アーキテクチャが必要です。私が考えている唯一の方法は、各ボルト インスタンス内でミニ バッチを実行してから集計することです。

ストーム内でミニバッチ処理を行うには、トライデントが適切なソリューションであることがわかりました。

属性に基づいてデータを分割できない場合に、嵐のような手段、グローバル カウント、std-devs を使用してグローバル分析を計算するためのベスト プラクティスは何ですか? トポロジの例はありますか?

4

1 に答える 1

2

Trident-MLを使用して計算された平均、標準偏差、カウントなどのストリーム統計を簡単に計算できます。READMEには、トライデント トポロジ内でこれらの統計を計算する方法を説明するセクションがあります。

それが役に立てば幸い。

于 2013-09-05T08:50:25.693 に答える