1

NCBIWWW を使用して biopython で blastn を実行しようとしています。
特定のサンプル ファイルで qblast 関数を使用しています。
私はいくつかのメソッドを定義しており、fasta に十分な長さのシーケンスが含まれている場合、すべてが魅力的に機能します。失敗する唯一のケースは、短すぎるイルミナ シーケンスからの読み取りを爆破する必要がある場合です。ということは、作品提出時に爆破パラメータの自動再定義がないことが原因ではないかと思います。

私はブラスト・ショートの条件に近づけるためにできる限りのことを試みました (ここの表 C2 を参照)。

正しいパラメーターを入力できないようです。

私が作業状況に近づいたと思うのは、次のとおりです。

result_handle = NCBIWWW.qblast("blastn", "nr",
                                fastaSequence,
                                word_size=7,
                                gapcosts='5 2',
                                nucl_reward=1,
                                nucl_penalty='-3',
                                expect=1000)

それを機能させるためのヒント/アドバイスをありがとう。

私のサンプル fasta read は次のとおりです。

>TEST 1-211670
AGACTGCGATCCGAACTGAGAAC

私が得るエラーは次のとおりです。

>ValueError: Error message from NCBI: Message ID#24 Error: Failed to read the Blast query: Protein FASTA provided for nucleotide sequence

そして、このページを見ると、私の問題はしきい値の修正にあるようですが、明らかにこれまでのところ機能させることができませんでした.

助けてくれてありがとう。

4

2 に答える 2

0

このコードは私にとってはうまくいきます(Biopython 1.64):

from Bio.Blast import NCBIWWW

fastaSequence = ">TEST 1-211670\nAGACTGCGATCCGAACTGAGAAC"

result_handle = NCBIWWW.qblast("blastn", "nr",
                               fastaSequence,
                               word_size=7,
                               gapcosts='5 2',
                               nucl_reward=1,
                               nucl_penalty='-3',
                               expect=1000)

print result_handle.getvalue()

間違った fastaSequence を渡している可能性があります。Biopython は、SeqRecords (またはその他のもの) からプレーンな FASTA への変換を行いません。上記のようにクエリを提供する必要があります。

Blast は、配列が最初の数文字を読み取るヌクレオチドまたはタンパク質であるかどうかを判別します。それらが閾値を超える「ACGT」にある場合、それはヌクレオチドであり、そうでない場合はタンパク質です。したがって、配列は「ACGT」の 100% のしきい値にあり、タンパク質として解釈することはできません。

于 2014-07-02T20:01:12.487 に答える