私は機械学習の初心者です。これまでのところ、データセット内の他のレコード(k-meansなど)との(多数のフィールドの)レコードの非類似度をほぼ測定するアルゴリズムを見てきました。
ネットワーク侵入検知にいくつかのmlアルゴリズムを適用しようとしていますが、そのようなアルゴリズムは、レコードのコンテキスト内のレコードではなく、個々のエンティティとしてレコードを考慮しているため、不適切である可能性があると考えています(つまり、特定のレコードが続く、または続く) )。たとえば、同期パケットに対応するレコードは、通常のトラフィックのレコードの中に存在する場合は正常である可能性がありますが、このレコードが他の多くの同期レコードの中に存在する場合は、同期フラッディング攻撃に対処している可能性があります。それはほんの一例です...私は自分自身を明確にしたいと思います。
この機能を備えたアルゴリズムはありますか?もしそうなら、誰かがポインタを与えることができますか?
前もって感謝します!