2

ベクトルに一連のデータがあります。データのヒストグラムをプロットすると、(巧妙な調査により) データが 3 つの分布の合計として分布していることがわかりました。

x_1 を中心とし、分散が s_1 の 1 つの正規分布。x_2 を中心とし、分散が s_2 の 1 つの正規分布。一度対数正規分布。

私のデータは明らかに「実際の」データのサブセットです。

私がやりたいことは、データからランダムなサブセットを取り出して、結果のサブセットが元のデータの合理的な代表サンプルになるようにすることです。

私はmatlabでこれをできるだけ簡単にやりたいと思っていますが、統計とmatlabの両方が初めてで、どこから始めればよいかわかりません.

助けてくれてありがとう:)

4

1 に答える 1

0

3 つの分布のそれぞれを特定できる場合 (パラメーターを推定できるという意味で)、データのランダムなサブセットを選択し、各分布のパラメーターを推定して、それらが十分に近いかどうかを確認することが 1 つの方法です。 (「近い」という独自の定義によると)元の分布のパラメーターに。このプロセスを数回繰り返し、ランダムなサブセット サイズでの平均差を調べる必要があります。

于 2013-04-09T01:24:29.557 に答える