私は rosalind プロジェクトの課題を解決しようとしていますが、明らかに間違いを犯し続けています。全文はこちらから入手できますが、私の短い抽象的な解釈と試みは次のとおりです。私が間違っていることを見つけるのを手伝ってください:
AA、Aa、の 3 つの項目グループがありますaa。1 in から始めて、新しいアイテムを生成する反復をAa行います。kすべての反復で、グループ内のすべてのアイテム:
Aa( 25AA%)、Aa(50%)、aa(25%)AA( 50AA%)、Aa(50%)aa( 50aa%)、Aa(50%)
反復の結果として、前の反復で各グループから 2 つの新しいアイテムを生成すると仮定して、各グループの予想アイテム数をカウントします。したがって、最終的には次のようになります。
- 0番目の反復:
AA: 0,Aa: 1,aa: 0 - 1回目の反復:
AA: .5,Aa: 1,aa: .5 - 2回目の反復:
AA: 1,Aa: 2,aa: 1 - 等 - グループ間の割合は 1:2:1 のまま
各反復の期待値/母集団の合計は で2^iterationあり、アイテムがグループに含まれる確率Aaは常に 50% です。
これまでのところ、私が正しいことを願っていますが、実際に求めているのは、実験を 2 回繰り返した場合に、少なくとも 2 回Nグループに含まれるアイテムを持つ可能性はどのくらいかということです。(同等である必要があります: 元の質問から、グループのリストを, , ....に拡張した場合Aa、少なくともNアイテムがグループに含まれる可能性は何ですか)AaBbAABBAABb
したがって、アイテムが含まれる確率Aaは 50% であり、反復 (または ) からの期待値の母集団の合計であり2^iteration、テスト データ (k=2、N=1) を使用して scipy でそれをスローすると、少なくとも 1 つのアイテムについてこれが得られます。グループ内Aa:
In [75]: bin = scipy.stats.binom(4, .5)
In [76]: sum(b.pmf(x) for x in range(1, 4+1))
Out[76]: 0.93750000000000022
これは、グループのセットが 2 つある場合、少なくとも 1 つのアイテムに対して、次のようになりAaBbます。
In [77]: sum(b.pmf(x) for x in range(1, 4+1))**2
Out[77]: 0.87890625000000044
元の質問の答えとはまったく異なります: 0.684
どこで間違いを犯したのですか?(可能であれば、自分で解決しようとしている人にネタバレが残らないように、解決策を示すのではなく、間違いだけを指摘してください)