0

さまざまなシステム監視ツールを評価して、1 つを使用して Hadoop クラスターを監視しています。私が感銘を受けたツールの 1 つが collectl です。私は数日以来それをいじっています。

colmux を使用しているときに、collectl によってキャプチャされたメトリックをどのように集計できるかを見つけるのに苦労していますか?

たとえば、Hadoop クラスターに 10 個のノードがあり、それぞれが collectl をサービスとして実行しているとします。colmux を使用すると、各ノードのパフォーマンス メトリックを 1 つのビュー (1 行および複数行の形式) で確認できます。すごい!

しかし、クラスター内のすべてのノードで CPU や IO などの集計を検討している場合はどうなるでしょうか。つまり、各ノードのパフォーマンス メトリックを対応する数値に集計することで、クラスター全体がどのように機能しているかを調べたいと考えています。これにより、ノード レベルではなくクラスター レベルのメトリックが得られます。

どんな助けでも大歓迎です。ありがとう!

4

1 に答える 1

1

私はすでにメーリングリストでこれに答えましたが、そうでない人の利益のためにここで繰り返します..

それはクールなアイデアです。ですから、私があなたのことを正しく理解していれば、下部にある種の合計線が表示されるかもしれません? いつでもウィッシュ リストに追加できますが、約束はできません。しかし、自分で少し余分な作業をしてもかまわない場合は、解決策もあると思います;)ところで-矢印キーで並べ替え列を変更できるようにreadkeyをインストールしたと仮定できますか?

--noesc を指定して colmux を実行すると、全画面表示がなくなり、すべてがスクロール出力として単純に出力されます。さらに "--lines 99999" (または大きな数字) を含めると、すべてのリモート システムからのすべての出力が表示されるので、何も見逃すことはありません。最後に、perl、python、bash、またはお気に入りのスクリプト ツールを介して出力をパイプし、合計を自分で実行できます。次に、新しいヘッダーが飛び交うのを見るたびに、合計を出力し、カウンターを 0 にリセットします。タイムスタンプを追加して、最終的には独自のオープンソース プロジェクトにすることもできます。他の人も役に立つと思います。

-マーク

于 2015-06-19T15:51:38.417 に答える