3 のリーディング フレームを使用して特定のパターンを検出し、そのシーケンスから 3 の倍数で別のパターンを見つけることができるスクリプトを作成しようとしています。
sequence = 'TCATGAGGCTTTGGTAAATAT'
私はそれが必要です:
...目的のパターン (つまり、「ATG」) が見つかるまで、読み取りフレーム 3 でスキャンします。
...元のシーケンスで最初のパターン ('ATG') が開始した位置と、2 番目のパターンが開始した位置 ('TAA') をマークします。この場合、「ATG」の場合は 3 位、「TAA」の場合は 15 位になります。
...最初のパターンから 2 番目のパターン 'TAA' に到達するまでの各トリプレットのリストを作成します (つまり、'ATG','AGG','CTT',TGG','TAA')
3 のセットで読み取るための読み枠を作成するにはどうすればよいですか? 読み取り値を取得する方法を見つけたら、ifステートメントを作成できることを知っています
reading_frame=[]
for frame in sequence:
if k == 'ATG':
reading_frame.append(k)
最初に読み枠が必要です