ストームの導入を検討していますが、少し心配です。現在、Hadoop MapReduce を実行しており、処理の一部を MapReduce から Storm プロセスに移行したいと考えています。これは一部であり、すべてではないことに注意してください。MapReduce 機能はまだいくつかあります。
同じハードウェア上で Storm と Hadoop の展開を (潜在的に) 維持できる Mesos を見つけましたが、他にもいくつかの問題がありました。
Storm と Hadoop の間で任意にスロットを「借りる」ことができるのが理想的な状況だと思います。元。どちらも必要に応じて同じリソースを使用します。残念ながら、これは固定展開であり、EC2 などのような「クラウド ベース」ではありません。
Storm 環境でのボトルネックを回避したいと考えています。理想的なケースは、必要に応じてより多くのボルトのインスタンスを "スピンアップ" (またはその逆) することです。これは可能/現実的ですか?
トポロジの「再起動」は、かなり費用のかかる操作のように思えますが、それが実際にオプションであるかどうかはわかりません。理想的には、可能な限りシームレスにしたいと思います。
この問題に正しく取り組んでいますか? 基本的に、Storm トポロジは MapReduce バッチ ジョブを「フィード」します。一部の処理はストリーミング方式で処理でき、Storm トポロジとしてははるかに優れていますが、一部はバッチ処理が必要です。
私の特定の質問に対応していなくても、一般的なフィードバックは大歓迎です。現時点では、これは探索的な段階であり、完全に間違った方法でアプローチしている可能性があります。