5

私は、ACGT ゲノム内の配列のメジアン文字列検索を実行しようとしています。私が抱えている問題は、考えられるすべての組み合わせを試してみるまで、AAAAAAAA から AAAAAAAC などを言うことです。

私は基本的に、A、C、G、T を含む 2 つのリストと 8 文字のシーケンスを含む 2 つのリストを作成し、各検索の後に文字を繰り返して交換することで、力ずくで行ってきました。問題は、2 つが同時に繰り返されると文字がジャンプするため、すべての組み合わせをテストしていないことです。

AAAAAAAA - AAAAAAAC - AAAAAAAG - AAAAAAAT - AAAAAACA などを簡単に行う方法はありますか?

4

3 に答える 3

10

使用するitertools

itertools.product("ACGT", repeat=8)
于 2012-07-13T02:19:31.657 に答える
2

上記のように itertools を使用することを提案しました。

itertools.product("ACGT", repeat=8) # will work in your case.
于 2012-07-13T02:24:53.193 に答える
1

pyparsing wikiの例ページから正規表現インバーターを使用して、この正規表現を反転します[ACGT]{8}UtilityMillでオンラインインバーターを試すこともできますが、このサーバーは8文字の文字列を生成するとタイムアウトしますが、許可された時間内に最大6文字を正常に取得できました。

于 2012-07-13T05:13:13.893 に答える