0

私は FASTA に 1000 のタンパク質配列とそれらのアクセッション番号を持っています。全ゲノム ショットガン データベースに戻り、最初の配列のリストにあるものと同一のタンパク質をコードするすべての DNA 配列を取得したいと考えています。

シーケンスごとに 10 件未満の結果、クエリごとに 1 件、e-value が 1e-100 未満、または e-value がゼロの tBlastn を実行しようとしましたが、結果が得られません。このプロセス全体を自動化したいと考えています。

これは、コマンド ラインとバッチ スクリプトから blast を実行することで実行できるものですか?

4

2 に答える 2

0

少なくとも1 つの結果が得られるはずです: 元のタンパク質をエンコードする結果です。私があなたに従えば、他のものは、もしあれば、偽遺伝子になります。

とにかく、ちょっとしたプログラミングが役立つかもしれません。 Biopythonをチェックしてください。Bioperl や Bioruby にも同様の機能があるはずです。特に、Biopython を使用して BLAST を実行できます

于 2014-12-08T09:37:45.990 に答える
0

次のリンクが役立つ場合があります。

https://www.biostars.org/p/5403/

そこでも同様の質問がされており、いくつかの合理的な解決策が投稿されています。

于 2014-12-09T21:35:15.390 に答える