1

BLAST 結果の上位 10 シーケンスを取得したい (シーケンスのみ、アライメント、スコア、e 値などなし)。5 つの fasta ファイルを含むテキスト ファイルを入力しています。したがって、出力は各 fasta ファイルの上位 10 件のブラスト ヒットになるはずです。したがって、出力ファイルには 50 のシーケンスが含まれます。

Bio.SeqIO を介して各入力 fasta ファイルを読み取り、temp.faa として書き込み、サブプロセスを介してコマンドライン BLAST に次のように渡します。

blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2

出力には他にも多くの情報があります。この出力を今解析する必要がありますか、それとももっと良い方法があります。

ありがとう

PS XML は 1 つの方法かもしれませんが、関連する NCBIXML パーサー構文が見つかりませんでした。

4

1 に答える 1