L と D の両方が発生する確率 P(L,D) を計算する必要がありますが、それらは相互に独立していません。2 つの異なるモデルを使用して P(L) と P(D) の確率を推定しました。また、P(L|D) と P(D|L) もわかっています。私が見る限り、P(L,D) には 2 つの異なる推定値があります。
P(L) * P(D|L) and
P(D) * P(L|D)
結合された P(L,D) に対してこれら 2 つの推定値を平均するだけでよいでしょうか?
L と D の両方が発生する確率 P(L,D) を計算する必要がありますが、それらは相互に独立していません。2 つの異なるモデルを使用して P(L) と P(D) の確率を推定しました。また、P(L|D) と P(D|L) もわかっています。私が見る限り、P(L,D) には 2 つの異なる推定値があります。
P(L) * P(D|L) and
P(D) * P(L|D)
結合された P(L,D) に対してこれら 2 つの推定値を平均するだけでよいでしょうか?
結合分布を計算するこれら 2 つの方法は、数値精度内で同じでなければなりません。アルゴリズムがこれら 2 つの方法に対して異なる答えを返す場合、それはコードのバグです。
バイナリ変数のペアの場合、必要なことは、4 つの結果のそれぞれの発生回数を維持することだけです(L,D), (!L,D), (L,!D), (!L,!D)
。私たちがさせればZ=N(L,D)+N(!L,D)+N(L,!D)+N(!L,!D)
次に、気にする確率は次のとおりです。
P(L,D)=N(L,D)/Z
他の (限界、条件付き) 確率は次のとおりです。
P(L)=[N(L,D)+N(L,!D)]/Z
P(D)=[N(L,D)+N(!L,D)]/Z
P(L | D ) = N(L,D)/[ N(L,D)+N(!L,D)]
P(D | L ) = N(L,D)/[ N(L,D)+N(L,!D)]
少しの代数でそれを見ることができますP(L|D)P(D)=N(L,D)/Z=P(D|L)P(L)
これは、異なる見積もりを単一の見積もりに組み合わせる方法を示しています。それらを「カウント」に戻してから、これらのカウントを追加します。これが発生する可能性があるのは、2 つの独立したサンプルS1
がある場合S2
です。P(L |D ), P(D)
sampleS1
とsampleP(D |L), P(L)
から推定
したとしますS2
。確率に加えて、各サンプルのサンプル数のカウントを知る必要があります: N1,N2
. 注: 結果は ratio のみに依存するN1/N2
ため、カウントがなくてもサンプル サイズが常に同じであることがわかっている場合は、N1=N2=1
次のように置き換えることができます。
N(L,D | S1 ) = N1*P(L | D) P(D)
N(L,D | S2 ) = N2*P(D | L) P(L)
N(L,D | S1+S2) = N(L,D|S1)+N(L,D|S2)
P(L,D | S1+S2) = N(L,D|S1+S2)/(N1+N2)
の場合は、N1==N2
それらを平均するだけです。しかし、それはサンプルサイズが同じである特別な場合にのみ当てはまります。それ以外の場合、結果は加重平均になります。
これは、 CrossValidated に関するこの質問に対する Bill の回答の簡略版であり、推定量が相関している可能性がある場合や、経験的確率以外の量の推定を伴う場合を処理します。