1

ディリクレ過程を扱う場合、[Teh, 2007] によれば、DP はベース確率 H とスケール係数「アルファ」によって定義されます。

Stick Breaking Construction によると、ランダムは DP から G を引き出します。

G~DP(α,H)

によって与えられます:

G=sum(pi_k*delta_theta_k) 1 から無限大までの k

pi_k は、単一の棒の長さが与えられたベータ分布からの順序付けされた描画です

delta_theta_k は、「theta_k」を中心とする質量点です (theta_k は基本分布からランダムに描画されます)。

私はすべての変数をほぼ明確に理解していますが、「マスポイント」が何を意味するのか、それがそのドローの確率密度なのか、それとも何か他のものなのかわかりません。

任意の方向に私を向けることができれば素晴らしいと思います.参考だけが素晴らしいでしょう.

ありがとう

4

1 に答える 1

1

G は、確率分布に対する確率分布です。これらの (サブ) 確率分布は、あるドメインにわたっています。これを BigTheta と呼びましょう。

各 theta_k は BigTheta 上の分布からのドローであるため、BigTheta の一部の要素です。

各 delta_theta_k は、BigTheta 上の確率分布であり、delta_theta_k(theta_k) = 1 および delta_theta_k(その他) = 0 と定義されています。これは、分布のすべての質量が単一の点にあるため、「点質量」分布と呼ばれるものです。ドメインのポイント。

G は BigTheta 上の確率分布の確率分布であり、次のように定義されます: f と呼ばれる BigTheta 上のいくつかの分布 (theta によってパラメーター化される) について、G(f(theta)) = sum (pi_k * delta_theta_k(theta))。

お役に立てば幸いです。一般的には、表記が少し複雑になる可能性があるという正しい考えをお持ちだと思います(そして、SOはこの種の表記には最適ではありません)。一般に、シンボルに遭遇したときはいつでも、それがどのタイプの関数であるか、つまり何に対して定義されているかを考えると役に立ちます。

于 2010-10-26T15:06:36.253 に答える