-1

私は機械学習の初心者です。これまでのところ、データセット内の他のレコード(k-meansなど)との(多数のフィールドの)レコードの非類似度をほぼ測定するアルゴリズムを見てきました。

ネットワーク侵入検知にいくつかのmlアルゴリズムを適用しようとしていますが、そのようなアルゴリズムは、レコードのコンテキスト内のレコードではなく、個々のエンティティとしてレコードを考慮しているため、不適切である可能性があると考えています(つまり、特定のレコードが続く、または続く) )。たとえば、同期パケットに対応するレコードは、通常のトラフィックのレコードの中に存在する場合は正常である可能性がありますが、このレコードが他の多くの同期レコードの中に存在する場合は、同期フラッディング攻撃に対処している可能性があります。それはほんの一例です...私は自分自身を明確にしたいと思います。

この機能を備えたアルゴリズムはありますか?もしそうなら、誰かがポインタを与えることができますか?

前もって感謝します!

4

2 に答える 2

1

隠れマルコフモデルやカルマンフィルターなどのステートフルメソッドを調べる必要があります。これらは実際にcontrxtを考慮に入れています。

または、先行する値の長いベクトルを作成し、それを使用してコンテキストを推測することもできますが、HMMは一般的に使用する方法であり、理論的および実用的な多くの利点があります。

于 2013-02-10T14:15:04.590 に答える
0

あなたは正しい地域にいます。クラスタリングではなく、分類アルゴリズムに興味があると思います。

持っているデータをクラスタリングすることで、どの特性が重要であるかについてのアイデアを得ることができます。しかし、それはあなたが要求が敵対的であるかどうかを決定することを可能にする分類です。スパムフィルタリングとの共通点があります。

于 2013-02-10T14:15:13.777 に答える