2

ソースからデータを受け取り、そのデータを複数のターゲット アプリケーションに配布するデータ配布アプリケーションに取り組んでいます。8 日間、1 秒ごとに複数のメッセージを正常に配信した後、メッセージを 1 つ逃し、クライアントに適切に配信しませんでした。

ログを見ていると、ミスが発生した時点で特別な何かを見つけようとしました-データ、そのレート、またはその他の条件のいずれかでしたが、何も見つかりませんでした.

特定のイベントが他のイベントとどのように異なるかを特定するために使用できるデータ マイニング手法はありますか?

4

4 に答える 4

2

外れ値の検出を見ることができます。基本的な手法は、多くのメッセージに対していくつかの変数をプロットし、このメッセージが文字通り目立つかどうかを確認することです。3つ以上の次元を同時に視覚化する方法は、平行座標です。たとえば、30分ビンを調べて統計を計算し、このメッセージの周囲に問題があったかどうかを確認する必要があるかもしれません。

于 2009-05-25T11:48:48.260 に答える
0

申し訳ありませんが、これがデータ マイニングとは何かについての誤解に他ならないことがわかりません。

問題のあるメッセージを既に知っているので、それが「外れ値」であることがわかります。では、何のために「マイニング」を行っているのでしょうか?

于 2009-09-10T03:49:53.547 に答える
0

ここでは、データ マイニングが適切なツールではないと思います。

私はいくつかの体系的なログを追加し(インターフェイスで、内部状態の変化を推測するのが難しく、あなたの場合、配布するかどうかの決定が下された理由)、問題を再現しようとし、ログから何が問題なのかを正確に把握します。何百万ものメッセージと、このようなまれにしか発生しないバグでは難しいかもしれませんが.

于 2009-05-25T12:32:30.420 に答える