私は10個のノードを含むクラスターを持っていますが、そのすべてが同様のオペレーティングシステム(ubuntu 10.4)を持っています。基本的に各ノードのパフォーマンスを監視したいのですが、特定の時間にCPU、メモリなどをキャプチャします。各ノードで同じものをキャプチャするにはどうすればよいですか?結果を集計して、結合された結果を取得します。クラスタ全体の平均 CPU 使用率の例。
実行して結果を取得できるコマンドはありますか。
前もって感謝します。
私は10個のノードを含むクラスターを持っていますが、そのすべてが同様のオペレーティングシステム(ubuntu 10.4)を持っています。基本的に各ノードのパフォーマンスを監視したいのですが、特定の時間にCPU、メモリなどをキャプチャします。各ノードで同じものをキャプチャするにはどうすればよいですか?結果を集計して、結合された結果を取得します。クラスタ全体の平均 CPU 使用率の例。
実行して結果を取得できるコマンドはありますか。
前もって感謝します。
pbsnodes コマンドの出力を使用して、この情報を取得できます。ステータスを見ると:
status = rectime=1319751989,varattr=,jobs=,state=free,netload=904408724,gres=,loadave=0.63,ncpus=6,physmem=8193856kb,availmem=14823060kb,totmem=16581436kb,idletime=362,nusers=1 、nsessions = 15、sessions = 1788 1171 19146 19183 19197 19217 19282 19329 19553 19617 20238 20292 20535 20601、uname = Linux napali 2.6.38-12-generic ,opsys=Linux
そこには、コンピューターの負荷平均と、マシンのメモリ状態に関するいくつかの情報が含まれていることがわかります。探している計算を実行する解析スクリプトを作成することで、問題を解決できます。