データの「ノイズ」を正しくキャッチしたとどのように主張できるのでしょうか。
より具体的には、主成分分析を例にとると、PCAでは、SVDを実行した後、小さな特異値をゼロにし、低ランク近似を使用して元の行列を再構築できることがわかっています。
次に、無視されたのは実際にデータのノイズであると主張できますか?これに対する評価指標はありますか?
私が思いつくことができる唯一の方法は、再構築されたデータから元のデータを単純に差し引くことです。
次に、ガウス分布をその上に合わせて、フィットネスが良好かどうかを確認します。
それはDSPのような分野での従来の方法ですか?
ところで、典型的な機械学習タスクでは、測定はフォローアップ分類パフォーマンスになると思いますが、私は純粋に生成モデルを実行しているため、ラベルは付けられていません。