次の要件を満たす機械学習アルゴリズムが必要です。
- トレーニング データは一連の特徴ベクトルであり、すべてが同じ「正」のクラスに属しています (負のデータ サンプルを生成できないため)。
- テスト データは、陽性クラスに属する場合と属さない場合があるいくつかの特徴ベクトルです。
- 予測は、陽性サンプルからの「距離」を示す連続値である必要があります (つまり、0 はテスト サンプルが明らかに陽性クラスに属することを意味し、1 は明らかに陰性であることを意味しますが、0.3 はやや陽性であることを意味します)。
例: 特徴ベクトルが 2D 特徴ベクトルであるとしましょう。
正のトレーニング データ:
- (0, 1), (0, 2), (0, 3)
テストデータ:
- (0, 10) は異常であるべきですが、明確なものではありません
- (1, 0) は異常であるはずですが、(0, 10) よりも「ランク」が高くなります
- (1, 10) は異常である必要があり、異常の「ランク」はさらに高くなります