1

私は機械学習の問題に取り組んでおり、データにいくつかの外れ値があり、それらを平滑化したいと考えています。そのような問題を解決するためにm-estimateを使用することについて何かを読みました。私はWebとstackoverflowの両方を徹底的に検索しましたが、良い例を見つけることができませんでした。誰かが私がこのトピックについてもっと読むことができるいくつかのリソースを提案できますか?

ありがとう!

4

1 に答える 1

1

私がよく覚えているなら、M推定器はHuberの仕事に由来します。彼は推定量を堅牢にする方法を研究しました。ただし、堅牢性を測定するために、非常に特殊なタイプの堅牢性が考慮されました。これは「ブレークダウンポイント」と呼ばれ、メソッドが処理できるポイントの総数に対する外れ値のパーセンテージを単純に示します。もう1つの外れ値、およびそれは故障します。

このタイプの堅牢性は、コンピュータビジョンの堅牢性とはまったく異なることに注意してください。コンピュータービジョンでは、外れ値は多くないかもしれませんが、最も堅牢な推定量を分解するために(構造化されたポイントの形で)共謀する可能性があります。そのためのコンピュータビジョンでは、ハフ変換RANSACに遭遇して、線のロバストな推定を実行します。

また、外れ値に対して非常に回復力のあるタイプのM推定器は、極端な外れ値に割り当てられた値を制限するM推定器です。これらは、いわゆる再降順M推定器です。と呼ばれる極端な外れ値にgross outliersはゼロの重みが割り当てられているため、つまり回帰ではまったく考慮されていないため、これらは非常に堅牢です。

単一の外れ値の影響を知りたい場合は、単純な線形最小二乗オクターブプログラムを作成するように挑戦します。または、より簡単だと思う場合は、完全最小二乗プログラム(特異値分解を実行でき、svd組み込みです)。

于 2014-06-10T22:09:56.080 に答える