5

私は rosalind プロジェクトの課題を解決しようとしていますが、明らかに間違いを犯し続けています。全文はこちらから入手できますが、私の短い抽象的な解釈と試みは次のとおりです。私が間違っていることを見つけるのを手伝ってください:

AAAa、の 3 つの項目グループがありますaa。1 in から始めて、新しいアイテムを生成する反復をAa行います。kすべての反復で、グループ内のすべてのアイテム:

  • Aa( 25 AA%)、Aa(50%)、aa(25%)
  • AA( 50 AA%)、Aa(50%)
  • aa( 50 aa%)、Aa(50%)

反復の結果として、前の反復で各グループから 2 つの新しいアイテムを生成すると仮定して、各グループの予想アイテム数をカウントします。したがって、最終的には次のようになります。

  • 0番目の反復: AA: 0, Aa: 1, aa: 0
  • 1回目の反復: AA: .5, Aa: 1, aa: .5
  • 2回目の反復: AA: 1, Aa: 2, aa: 1
  • 等 - グループ間の割合は 1:2:1 のまま

各反復の期待値/母集団の合計は で2^iterationあり、アイテムがグループに含まれる確率Aaは常に 50% です。

これまでのところ、私が正しいことを願っていますが、実際に求めているのは、実験を 2 回繰り返した場合に、少なくとも 2 回Nグループに含まれるアイテムを持つ可能性はどのくらいかということです。(同等である必要があります: 元の質問から、グループのリストを, , ....に拡張した場合Aa、少なくともNアイテムがグループに含まれる可能性は何ですか)AaBbAABBAABb

したがって、アイテムが含まれる確率Aaは 50% であり、反復 (または ) からの期待値の母集団の合計であり2^iteration、テスト データ (k=2、N=1) を使用して scipy でそれをスローすると、少なくとも 1 つのアイテムについてこれが得られます。グループ内Aa:

In [75]: bin = scipy.stats.binom(4, .5)
In [76]: sum(b.pmf(x) for x in range(1, 4+1))
Out[76]: 0.93750000000000022

これは、グループのセットが 2 つある場合、少なくとも 1 つのアイテムに対して、次のようになりAaBbます。

In [77]: sum(b.pmf(x) for x in range(1, 4+1))**2
Out[77]: 0.87890625000000044

元の質問の答えとはまったく異なります: 0.684

どこで間違いを犯したのですか?(可能であれば、自分で解決しようとしている人にネタバレが残らないように、解決策を示すのではなく、間違いだけを指摘してください)

4

1 に答える 1

1

私は最初にあなたの例に従い、それは理にかなっているようだと思いましたが、しばらくして問題がどこにあるかを見つけました。

ここにあなたの間違いへのポインタがあります:

Aa--第2世代で少なくとも1つ、少なくとも1つを取得する確率を計算しました--BbAaBbしかし、これは、第2世代に少なくとも1つあるかどうかを確認するのに十分ではなく、Aa----Bbは一致する必要があります。

たとえば、次の第2世代について考えてみます。aaBb, AABb, Aabb, AaBBすべての個人がどちらAa--かを持っているか、または持って--BbいませんAaBbが、世代にはありません。

于 2013-02-08T09:00:11.753 に答える