実際に採取したデータの分布に合わせた疑似データを生成したい。iPhone 開発のための C/Obj-C での効率的で正確な方法を探しています。現在、1000 のサンプリングされたイベントでの 60 の異なるカテゴリの発生には、確率 (0-1) が割り当てられています。同じ確率に適合する 1000 個の新しいイベントを生成したいと考えています。
明確化 {
セット {1,2,...,60} のカテゴリ分布があります。この分布のサンプルが各カテゴリの確率に適合することを理解しています。したがって、この分布から 1000 個のサンプルを取得する必要があります。私は(これまでの回答のおかげで)次のことを行う必要があると判断しました。
値を合計し、それぞれを合計で割ることによって、この分布を正規化します。
それらを注文します。
各値を以前のすべての値の合計に置き換えて、CDF を作成します。
次に、0 から 1 の間の一様乱数を生成し、選択した数値以下の値を持つ CDF 内の最大の数値を見つけ、この CDF 値に対応するカテゴリを返します。
}
Q1 . これは問題を解決する正しい方法ですか?
Q2 . カテゴリの確率を格納するために NSDecimals を使用しているという警告は引き続き保持されます。これを簡単に行うために使用できるライブラリや Cocoa や Math.h などの関数はありますか? 私は新しいライブラリを試すことにオープンです。現在、このプロジェクトには Core-Plot と標準の Cocoa ライブラリしかありません。ありがとう。