それぞれがCPU /ネットワーク/ディスクなどのパフォーマンスに関する約200の統計を生成するノードのクラスターがあります。これまで、さまざまなノードのログファイルをループし、それらをノードごとのデータフレームオブジェクトに解析し、dictに入れましたノード ID をキー:
(ここで、最初の列は DataFrame のインデックス ラベルです)
{ 'node00':
<DaFrame-display-begin>
core 0 core 1 core 2 core 3 group 0
Avg IPC (w/ idle) 0.09 0.12 0.06 0.06 0.08
Avg CPI (w/ idle) 11.17 8.03 15.62 16.97 12.95
Avg IPC (w/o idle) 0.48 0.78 0.64 0.63 0.63
Avg CPI (w/o idle) 2.10 1.28 1.56 1.59 1.63
User IPC (w/o idle) 0.70 1.02 0.85 0.84 0.85
........................................
,
'node01':
<DataFrame-display-begin>
Avg IPC (w/ idle) 0.05 0.12 0.06 0.06 0.08
Avg CPI (w/ idle) 9.17 8.03 15.62 16.97 12.95
Avg IPC (w/o idle) 0.48 0.78 0.64 0.63 0.63
Avg CPI (w/o idle) 2.10 1.28 1.56 1.59 1.63
User IPC (w/o idle) 0.70 1.02 0.85 0.84 0.85
}
統計の名前を引数として取り、クラスター内のすべてのノードで特定の統計の棒グラフをプロットする汎用関数を作成する予定です。異なるコアのバーを積み重ねたり、並べたりすることができます。ただし、簡単に比較するには、x 軸のポイントをノードにする必要があります。
助言がありますか?私は Pandas/matplotlib を初めて使用するので、ヒントがあれば幸いです。