-2

P(A=a|B=b,C=c)whereaは の要素['high', 'medium', 'low']、 b は の要素、['0-20', '20-40', '40-60', '60-80', '80-inf']cの要素である条件付き確率を計算しようとしてい['male', 'female']ます。

次のような頻度の辞書があります。

{('high', '0-20', 'female'): 11,
 ('high', '0-20', 'male'): 43,
 ('high', '20-40', 'female'): 10,
 ('high', '20-40', 'male'): 17,
 ('high', '40-60', 'female'): 11,
 ('high', '40-60', 'male'): 10,
 ('high', '60-80', 'female'): 2,
 ('high', '60-80', 'male'): 1,
 ('high', '80-inf', 'female'): 0,
 ('high', '80-inf', 'male'): 0,
 ('low', '0-20', 'female'): 130,
 ('low', '0-20', 'male'): 159,
 ('low', '20-40', 'female'): 186,
 ('low', '20-40', 'male'): 297,
 ('low', '40-60', 'female'): 71,
 ('low', '40-60', 'male'): 144,
 ('low', '60-80', 'female'): 35,
 ('low', '60-80', 'male'): 53,
 ('low', '80-inf', 'female'): 1,
 ('low', '80-inf', 'male'): 2,
 ('medium', '0-20', 'female'): 90,
 ('medium', '0-20', 'male'): 194,
 ('medium', '20-40', 'female'): 72,
 ('medium', '20-40', 'male'): 116,
 ('medium', '40-60', 'female'): 46,
 ('medium', '40-60', 'male'): 49,
 ('medium', '60-80', 'female'): 12,
 ('medium', '60-80', 'male'): 22,
 ('medium', '80-inf', 'female'): 1,
 ('medium', '80-inf', 'male'): 2}

私が欲しいのは、次のような辞書です。

{('high', '0-20', 'female'): P(A='high'| B='0-20', C='female'),
 etc...,
}
4

1 に答える 1

0

したがって、私があなたのコメントを正しく理解している場合、あなたが問題を抱えているのは、単一の条件とは対照的に、2つ以上の「条件」がある場合の条件付き確率を計算するという概念です。

最後に確率/統計のクラスを受講してからかなり時間が経ちましたが、これを別の問題に分解する必要があると思います。P(B=b)データから、とを簡単に計算できますP(C=c)B=b次に必要なのはANDの同時確率ですC=c。これは、データから直接取得できるはずです。たとえばP(high, 0-20)、両方の条件に一致するすべてのポイントの合計を合計数で割ったものです。この同時確率を と呼ぶ場合P(X)、条件付き確率の定義から P(A=a|X) = P(A=a ∩ X) / P(X) を計算するのはかなり簡単です。

ただし、確認やより良い回答を得るために、これを再投稿するか、Math SE サイトに移行することをお勧めします...

于 2015-01-06T18:28:40.647 に答える