1

私はfasta形式で約500のタンパク質配列を持っています、私はblastp検索から得ました。これらの配列から、タンパク質名、生物、Uniprot ID、および可能であればタンパク質ファミリーを取得して、その情報を含むテーブルを作成できるようにする必要があります。

Pythonを使用してそれを行う方法はありますか?Uniprotと通信するいくつかの機能?fastaヘッダーからの情報をどのように解析できますか?

4

1 に答える 1

5

FASTAパーサーを備えたBiopythonをご覧ください。解析後、パンダ DataFrameを使用してテーブルを作成できます。サンプルデータのスニペットがないと、より正確な答えを提供することは困難ですが、約5行のコードで実行できるはずです:)

from Bio import SeqIO
with open("example.fasta", "rU") as handle:
    print list(SeqIO.parse(handle, "fasta"))
于 2013-02-13T11:29:18.167 に答える