0

私は一連のデータを持っています。そのデータから 1 つのクラスの分布を構築したいと考えています。学習した分布に基づいて、各データ インスタンスの確率値を取得したいと考えています。この確率値 (しきい値) に基づいて、特定のデータ インスタンスがその分布から来ているかどうかを分類する分類器を構築したいと考えています。

この場合、50x100000 のデータがあるとします。ここで、50 は各データ インスタンスの次元であり、インスタンスの数は 100000 です。この分布に基づいてガウス混合モデルを学習しています。

インスタンスの確率値を取得しようとすると、非常に低い値が得られます。この場合、どうすれば分類子を構築できますか?

4

1 に答える 1

1

これは意味がないと思います。たとえば、データが 1 次元であると仮定し、実際にはバイモーダル分布からサンプリングされているとします。しかし、それが二峰性分布からのものであり、正規分布に適合することがわかっていないとします。あなたはまだ可能な限り最高の適合を持っていますが、それは間違った分布への可能な限り最高の適合であり、実際には、その分布またはそれに似た分布からのポイントはありません。

于 2013-06-14T16:52:21.270 に答える