NCBIWWW を使用して biopython で blastn を実行しようとしています。
特定のサンプル ファイルで qblast 関数を使用しています。
私はいくつかのメソッドを定義しており、fasta に十分な長さのシーケンスが含まれている場合、すべてが魅力的に機能します。失敗する唯一のケースは、短すぎるイルミナ シーケンスからの読み取りを爆破する必要がある場合です。ということは、作品提出時に爆破パラメータの自動再定義がないことが原因ではないかと思います。
私はブラスト・ショートの条件に近づけるためにできる限りのことを試みました (ここの表 C2 を参照)。
正しいパラメーターを入力できないようです。
私が作業状況に近づいたと思うのは、次のとおりです。
result_handle = NCBIWWW.qblast("blastn", "nr",
fastaSequence,
word_size=7,
gapcosts='5 2',
nucl_reward=1,
nucl_penalty='-3',
expect=1000)
それを機能させるためのヒント/アドバイスをありがとう。
私のサンプル fasta read は次のとおりです。
>TEST 1-211670
AGACTGCGATCCGAACTGAGAAC
私が得るエラーは次のとおりです。
>ValueError: Error message from NCBI: Message ID#24 Error: Failed to read the Blast query: Protein FASTA provided for nucleotide sequence
そして、このページを見ると、私の問題はしきい値の修正にあるようですが、明らかにこれまでのところ機能させることができませんでした.
助けてくれてありがとう。