問題タブ [blast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2612 参照

python - Biopython ローカル BLAST データベース エラー

Biopython の NcbiblastxCommandline ツールを使用して「nr」データベースで blastx をローカルで実行しようとしていますが、タンパク質データベースの検索パスに関して常に次のエラーが発生します。

ダウンロードした nr データベースを指すようにパスを変更する方法がわかりませんが、このコードをコマンドラインから問題なく実行できるため、パスを正しく指していると思いました。

上記のコマンド ライン コードは、予想どおり、ブラスト結果の xml ファイルを作成します。

Biopython NCBI コマンド ライン ツールを使用してこの問題を解決するための助けをいただければ幸いです。

0 投票する
0 に答える
494 参照

blast - 私は blast にインストールしており、ローカルの微生物データベースを使用して BLAST 検索を実行しています。「blastn」が機能しました

微生物データベースのローカル コピーと共に、BLAST+ を Linux マシンにインストールしました。「blastn」は次のようなクエリで正常に機能します

ただし、blastp は失敗します。

与える

BLAST データベース エラー: タンパク質データベース [16SMicrobial] のエイリアスまたはインデックス ファイルが検索パス [..../databases] に見つかりませんでした

私のデータベースディレクトリにはこれらのファイルがあります-

16SMicrobial.nhr 16SMicrobial.nnd 16SMicrobial.nog 16SMicrobial.nsi 16SMicrobial.nin 16SMicrobial.nni 16SMicrobial.nsd 16SMicrobial.nsq

私の.ncbircファイルには

何が間違っている可能性がありますか?

0 投票する
1 に答える
1088 参照

python - blastx 出力ファイルから特定のエントリを抽出し、新しいファイルに書き込みます

XML 形式の Blastx 出力ファイル内で (ユーザーが指定した) キーワードを正常に検索するスクリプトを作成しました。ここで、アライメント タイトルにキーワードを含むレコード (クエリ、ヒット、スコア、evalue など) を新しいファイルに書き込む必要があります。

クエリ タイトル、ヒット タイトル、e 値、アライメントの長さごとに個別のリストを作成しましたが、それらを新しいファイルに書き込めないようです。

  • 問題 #1: Python エラーが発生し、リストの 1 つに値が欠落している場合はどうなりますか? 次に、他のすべてのリストは、クエリに関して間違った情報を提供します (「ライン スリッページ」、場合によっては...)。

  • 問題 #2: Python でエラーが発生せず、すべてのリストが同じ長さである場合でも、各リストの最初の項目が互いに関連付けられるように、それらをファイルに書き込むにはどうすればよいですか (したがって、からの項目 #10)各リストも関連付けられていますか?) 代わりに辞書を作成する必要がありますか?

  • 問題 3: 辞書にはキーの値が 1 つしかありません。クエリに複数の異なるヒットがある場合はどうなりますか? 上書きされるかスキップされるか、または単にエラーになるかどうかはわかりません。助言がありますか?私の現在のスクリプト:

    /li>
0 投票する
1 に答える
309 参照

python - Biopython でオンラインで BLAST を実行すると構文エラーが発生する

Biopython チュートリアルとクックブック (第 7 章)に従って、パイロシーケンシングの fasta ファイルをヌクレオチド GenBank データベースと比較するスクリプトを作成しようとしています。

プロセスの実行中、プロンプトに次のメッセージが表示されます。

そして、私は問題が何であるか、またはそれを修正する方法を知りません。スクリプトに後でエラーが発生する可能性があります。しかし今、私はそれで歩き続けることができません。

0 投票する
1 に答える
204 参照

biopython - Biopython ファイルが見つかりません

Python プロンプトから qblast を実行しようとしていますが、必要なすべてのライブラリをインポートした後、Python でファイルが見つかりません。

ファイルのすべてのルート (「/Users/imac...」) を書き留めて、ファイルを Python フォルダーと Biopython フォルダーに移動しようとしましたが、同じメッセージが表示されます。

ファイルをどこに保存すればよいですか? 私は何を間違っていますか?

0 投票する
2 に答える
555 参照

php - ファイルが見つかりませんが、ファイルは存在します

私は、ユーザーがデータベースに対してタンパク質配列を実行できるはずのサーバーで作業しており、それはblastallと呼ばれる実行可能ファイルを使用します。サーバーは実行可能ファイルを生成し、バッチを使用して実行する必要があります。ただし、実行されていないようです。実行可能ファイルの例は、generates(cmd.sh)です。

その最後のクレイジーな番号は、ジョブが送信された日時に基づいて自動生成されたジョブIDです。2つの問題があり、私は一度に1つずつ解決しようとしています。最初の問題は、手動で実行すると(./cmd.shを実行するだけで)、次のエラーが発生することです。

しかし、指定されたディレクトリには実際にはblastallが含まれているため、これは私にはあまり意味がありません。完全なrwx権限があり、途中のすべてのディレクトリに適切な権限があります。

ツールのblast.phpファイルは次のようになります。

もちろん、その上に変数宣言があり、do_blast関数は次のようになります(ここでも、その上に変数が宣言されており、ディレクトリが機能するようにcdがあります)。

この問題の原因は何ですか?私が実行していて、apacheによって作成されたためかもしれないと思いましたが、rwxはすべてのユーザーに許可されています。必要に応じてさらに情報を含めることもできますが、PHPを作成した元の人がすべてを大量の小さなファイルに分割したため、この時点では含めないことにしました。そのため、問題がどこにあるかを正確に特定することは困難です。どんなアイデアでも(完全な解決策ではないにしても)非常に高く評価されています。

編集:解決策が見つかりました。結局のところ、blastall実行可能ファイルは別のLinuxシステムでコンパイルされていました。別の実行可能ファイルに切り替えて、問題なく実行されました。

0 投票する
2 に答える
92 参照

database - ブラスト検索に時間がかかるようにする

私はこのリンクを参照しています:http ://www.ncbi.nlm.nih.gov/books/NBK52637/ 、単一のマシンでブラスト検索を試してみてください。私はNCBIWebサイトからblastアプリとrefseq_rnablastデータベースをdlしました。ブラスト検索は、結果を取得するためにわずか数秒かかります。ブラストデータベースで一致する配列を検索するのにブラスト検索にもっと時間がかかるようにする方法はありますか?

0 投票する
1 に答える
136 参照

xml - BLAST からの XML 出力ファイルがあります。PDB データベースで一致を見つけるにはどうすればよいですか?

ブラスト出力 XML ファイルがあり、Python を使用して出力ファイルと PDB 内の何かとの間のある種の相同性を見つけるために、ファイルの内容を RSCB Protein Data Bank を介して実行する方法を見つけたいと考えています。

私はまだこれらすべてに不慣れで、これを始めようとして困惑しています。前もって感謝します!

0 投票する
1 に答える
1416 参照

bash - bash を使用して科学表記法で数値を読み取る

De Novo魚ゲノムのアノテーション パイプラインの一部として、BLAST の e 値を比較して、それらが特定のしきい値よりも低いかどうかを確認する必要があります。

セマンティクスを正しくするために、最初に blast-output の他の列の 1 つを評価しました。これは次のように正常に動作します。

$4 は、数値全体 (ヒットの長さなど) を含む BLAST 出力の列です。

ただし、スクリプトを e 値を使用するように変更しようとすると、科学的表記法などの解釈に問題が発生します...

私が好きなのはこれです:

ここで、$11 は各ヒットの e-value を指します。

これは、bash で面倒でない方法で行うことができますか?

0 投票する
1 に答える
1893 参照

python - NcbiblastxCommandline によるカスタム blast db

biopython 内で blast を使用するのは初めてで、問題が発生しています。

以下を使用して、20 シーケンスを含む fasta ファイルからカスタム blast データベースを作成しました。

os.system('makeblastdb -in newtest.fasta -dbtype nucl -out newtest.db')

これにより、現在作業している現在のディレクトリ内にいくつかのファイル (newtest.db.nhr、newtest.db.nin、newtest.db.nsq) が生成されました: ( /home/User/Documents/python/fasta-files)

そして今、次を使用してbiopython内でこのデータベースにクエリを実行しようとしています:

しかし、私はこのエラーが発生しています:

から生成されたファイルをコピーしようとしました/home/User/Documents/python/fasta-files/usr/share/ncbi/blastdb、権限がないと表示されます。

*編集*

私が使用する場合:os.system("blastn -db newtest.db -query "fastafile.fas" + " -out test.txt") 正常に動作し、出力ファイルを生成します。しかし、その逆ではありません**

だから私はここで立ち往生しており、これを解決する方法がわかりません。

任意の助けをいただければ幸いです