BLAST 結果の上位 10 シーケンスを取得したい (シーケンスのみ、アライメント、スコア、e 値などなし)。5 つの fasta ファイルを含むテキスト ファイルを入力しています。したがって、出力は各 fasta ファイルの上位 10 件のブラスト ヒットになるはずです。したがって、出力ファイルには 50 のシーケンスが含まれます。
Bio.SeqIO を介して各入力 fasta ファイルを読み取り、temp.faa として書き込み、サブプロセスを介してコマンドライン BLAST に次のように渡します。
blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2
出力には他にも多くの情報があります。この出力を今解析する必要がありますか、それとももっと良い方法があります。
ありがとう
PS XML は 1 つの方法かもしれませんが、関連する NCBIXML パーサー構文が見つかりませんでした。