陽性クラスに属する非常に小さなデータと、陰性クラスの大量のデータがあります。教授によると。Andrew Ng (異常検出 vs 教師あり学習)、非常に歪んだデータのため、教師あり学習の代わりに異常検出を使用する必要があります。
間違っている場合は訂正してください。ただし、どちらの手法も同じように見えます。つまり、(教師あり) 異常検出と標準の教師あり学習の両方で、正常サンプルと異常サンプルの両方でデータをトレーニングし、未知のデータでテストします。違いはありますか?
同じサイズの両方の型データを取得するには、負のクラスのアンダーサンプリングまたは正のクラスのオーバーサンプリングを実行する必要がありますか? 全体の精度に影響はありますか?