分布xiを、いくつかの独立した基底分布f j:x i = a i1 f 1 + a i2 f 2 +...の線形結合として表現します。f jを、0..1または{0,1}(離散)に均一に分布する独立変数に制約します。ここで、私たちが知っているすべてのものを行列形式で表現しましょう。
Let X be the vector (x1, x2, .., xn)
Let A be the matrix (a_ij) of dimension (k,n) (n rows, k columns)
Let F be the vector (f1, f2, .., fk)
Let P be the vector (p1, p2, .., pn)
Let R be the matrix (E[x_i,x_j]) for i,j=1..n
Definition of the X distribution: X = A * F
Constraint on the mean of individual X variables: P = A * (1 ..k times.. 1)
Correlation constraint: AT*A = 3R or 2R in the discrete case (because E[x_i x_j] =
E[(a_i1*f_1 + a_i2*f_2 + ...)*(a_j1*f_1 + a_j2*f_2 + ...)] =
E[sum over p,q: a_ip*f_p*a_jq*f_q] = (since for p/=q holds E[f_p*f_q]=0)
E[sum over p: a_ip*a_jp*f_p^2] =
sum over p: a_ip*a_jp*E[f_p^2] = (since E[f_p^2] = 1/3 or 1/2 for the discrete case)
sum over p: 1/3 or 1/2*a_ip*a_jp
And the vector consisting of those sums over p: a_ip*a_jp is precisely AT*A.
次に、2つの方程式を解く必要があります。
AT*A = 3R (or 2R in the discrete case)
A*(1...1) = P
最初の方程式の解は、行列3Rまたは2Rの平方根を見つけることに対応します。たとえば、http://en.wikipedia.org/wiki/Cholesky_factorizationおよび一般的にはhttp://en.wikipedia.org/wiki/Square_root_of_a_matrixを参照してください。2番目のものについても何かをする必要があります:)
私は周りの数学者に私を訂正するように頼みます。なぜなら、私はATAとAATを混ぜたり、さらに間違ったことをしたりした可能性があるからです。
基底分布の線形混合としてxiの値を生成するには、2段階のプロセスを使用します。1)一様確率変数を使用して、対応する確率で重み付けされた基底分布の1つを選択します。2)を使用して結果を生成します。選択された基底分布。