0

前月のネットフロー データが 5 分ごとのファイルにあり、このすべてのトラフィックのパケット プロファイルを作成したいと考えています。1 パケット フロー、2 パケット フローなどのパーセンテージ表現が必要です。1 パケット フロー、1 ~ 100 パケット フロー、100 などのカテゴリで行うことができます。それほど重要ではありません。しかし、私の質問はそれを行う方法です。加算できないデータのパーセンテージ表示を行うには? すべてのファイルのパーセンテージ表現を行い、それからある種の平均を行うようなものはありますか?

4

2 に答える 2

0

ヒストグラムを説明しているように聞こえます。生のカウントで説明したサイズの「ビン」を作成します。ビンのカウントの合計は、セッションの合計数です。総トラフィックのパーセンテージを取得するには、各ビンを総フロー カウントで割って正規化します。

したがって、最初のビンが 100 未満のパケット フローと他の 100 以上のパケット フローを持つすべてのセッションのカウントである 2 ビン ヒストグラムを実行すると (ギャップやオーバーラップが存在できないことに注意してください)、それは次のように機能します。前者で 30 フロー、後者で 60 フローの場合、フローの総数は 90 で、フローの 33% は 100 パケット未満です。

複数のファイルを操作するときの秘訣は、常に同じビンの描写を使用し、生のカウントをできるだけ長く保存して操作し、最後のステップとして %s のみを導出することです。ビンが同じことを意味している限り、問題なくヒストグラムを一緒に追加できます。結果を正規化すると、ビンごとにすべてのファイルの合計パーセントが得られます。ファイルを追加する必要がある場合は、新しいデータがあるときに再正規化できるように、生のカウントを追跡してください。

これは、Matlab のようなツールで非常に簡単に実行できますが、これらのツールの多くは非常に親切にビンの幅を自動的に決定するため、注意が必要です。したがって、あるファイルのヒストグラムにはビン {x < 100, 100 <= x < 200, x >= 200} と別のファイル {x < 90, 90 <= x < 180, x >=180} があり、結果を合計することはできません。

于 2012-08-13T03:11:22.847 に答える
0

「合算できない」とは?マニュアルを見ると、実際にはnfdumpでそれを行うことができます: -R expr /dir/file1:file2 file1 から file2 までのすべてのファイルを読み取ります。たとえば

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639

は、16:09 から 16:39 までの NetFlow 情報を収集します。その後、そのデータに対して必要なクエリを実行できます。

于 2012-04-05T14:51:04.470 に答える