2

入力 fasta 形式のテキスト ファイル:

http://www.jcvi.org/cgi-bin/tigrfams/DownloadFile.cgi?file=/opt/www/www_tmp/tigrfams/fa_alignment_PF00205.txt

#!/usr/bin/python

from Bio import AlignIO

seq_file = open('/path/to/fa_alignment_PF00205.txt')
alignment = AlignIO.read(seq_file, "fasta")

エラー:

ValueError: Sequences must all be the same length

ClustalOmega では異なる長さのシーケンスをアラインできるため、入力シーケンスは同じ長さである必要はありません。

これも機能しません...同じエラーが発生します:

alignment = AlignIO.parse(seq_file,"fasta")

for record in alignment:
    print(record.id)

BioPython に精通している人は、これを回避して fasta ファイルからシーケンスを整列させる方法を知っていますか?

4

2 に答える 2

1

あなたの問題はfastaの最後の記録です...tail -9 fa_alignment_PF00205.txt

>SP|Q21VK8.1/229-357
LQAALAALAKAE...RP..LLVIGSQALVLSK..QAEHLAEAVARL.GIPV.YLSGMA..RGLLG.R..........DH.
................PLQ.................MRHQRRQALRE..ADCVLLAG.VP...CDFRLD...... YGKHV
RR........S.AT....L..IAA.N................. .....RSA........KDARLNR..
.......K...PD.IAAIGDAG.......LFLQAL
>SP|Q220C3.1/190-328
LTELQERLANAQ...RP..VVILGGSRWSD.A..AVQQFTRFAEAF.SLPV.FCSFRR..QMLFS.A..........NH.
...ACY...AG.DLGLG.A.....NQRLLARI.RQ..SDLILLLG.GR...MSEVPS...QGYEL
LGIPAPQQ..........D

ID のシーケンスSP|Q220C3.1/190-328は、他のシーケンスとは長さが異なります

于 2015-09-29T01:03:13.457 に答える