1

itertoolsを介してシーケンスのfastaファイルを作成するためのプログラムがあります。

import itertools
input=['ARIMALTHNAEYSDSFTAL','ARIMFLTHNFEYSESFTAL','AHIMNPTENAEYHESFTAL','AHIMNPTENTEYWDSFTAL','AHIMNDTHNFEYHDSFTAL','AHIMNDTNNTEYWESFTAL','ARIMFDTENAEYHDSFTAL','AHIMADTNNTEYWDSFTAL','ARIMFLTENTEYHESFTAL']

l=len(input[0])

my_residues=[set() for _ in xrange(l)]
for h in input: 
    for i,x in enumerate(h): 
        my_residues[i].add(x)

my_residues=[list(x) for x in my_residues]
fo=open('autotest.fasta','w')
vals=[]
for x in itertools.product(*my_residues): 
    val = ''.join(x)
    vals.append('>'+'\n'+val)
    print val

with open('autotest.fasta','w') as fo:
    fo.write('\n'.join(vals))
fo.close()

このプログラムは完全に機能しています。これにより、autotest.fastaという出力ファイルが次のように表示されます。

>
AHIMAPTHNAEYHESFTAL
>
AHIMAPTHNAEYHDSFTAL
>
AHIMAPTHNAEYSESFTAL
>
AHIMAPTHNAEYSDSFTAL
>
AHIMAPTHNAEYWESFTAL
>
AHIMAPTHNAEYWDSFTAL
...

ここで私が欲しいのは、出力autotest.fastaが次のようになるようにシーケンスに名前を付けることです

>00
AHIMAPTHNAEYHESFTAL
>01
AHIMAPTHNAEYHDSFTAL
>02
AHIMAPTHNAEYSESFTAL
>03
AHIMAPTHNAEYSDSFTAL
>04
AHIMAPTHNAEYWESFTAL
>05
AHIMAPTHNAEYWDSFTAL
...

あらゆる入力に適用できるようにします。

どんな助けでもいただければ幸いです。ありがとうございました。

4

1 に答える 1