1

経験的分布を使用してデータをシミュレートしようとしています。たとえば、以下のベクトルに示す確率を持つ 5 つの結果があるとします。

PROBABILITY_VECTOR = [0.1, 0.2, 0.3, 0.25, 0.15]

PROBABILITY_VECTOR は経験的データから計算されるため、そのベクトルの最初のカテゴリでは、平均確率は 0.1 ですが、サンプル間にはかなりの分散があります。同様に、最後のカテゴリは、すべてのサンプルの平均が 0.15 ですが、かなりの分散があります。確率が 0.3 と 0.25 の中間カテゴリは、かなりタイトです。

以下のステートメントで PROC IML を使用します。

CALL RANDSEED(12345);
CALL RANDGEN(SAMPLE, "TABLE", PROBABILITY_VECTOR);

これを行うと、予想どおり、シミュレートされたすべての結果の平均が確率ベクトルと一致します。しかし、シミュレートされた試行でも、データの一部のカテゴリで観察される広い分散を示したい場合は、どうすればよいでしょうか? 何か案は?

4

1 に答える 1