python - fastaシーケンス、pythonからテーブルを作成する

Question

私はfasta形式で約500のタンパク質配列を持っています、私はblastp検索から得ました。これらの配列から、タンパク質名、生物、Uniprot ID、および可能であればタンパク質ファミリーを取得して、その情報を含むテーブルを作成できるようにする必要があります。

Pythonを使用してそれを行う方法はありますか？Uniprotと通信するいくつかの機能？fastaヘッダーからの情報をどのように解析できますか？

score 5 · Accepted Answer

FASTAパーサーを備えたBiopythonをご覧ください。解析後、パンダ DataFrameを使用してテーブルを作成できます。サンプルデータのスニペットがないと、より正確な答えを提供することは困難ですが、約5行のコードで実行できるはずです:)

from Bio import SeqIO
with open("example.fasta", "rU") as handle:
    print list(SeqIO.parse(handle, "fasta"))

1 に答える 1