問題タブ [blast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
443 参照

python - reで.xmlブラスト出力を解析する

を使用して XML 形式の BLAST 出力を解析しようとしてreいますが、これまでに行ったことはありません。以下は私のコードです。

ただし、一部のヒットにはHsp_num複数回のヒットがある場合があるため、 と の結果が多くなり、query_fromの結果がquery_to少なくなりquery_lenます。ありがとうございましたHsp_numprint query_len

うまくいかなかっquery_lenたので別ファイルにしました。

0 投票する
1 に答える
70 参照

mpi - mpiblast ではどのようなスケーリングが期待できますか?

HPC クラスターでは、ユーザーの 1 人が 30 コア以上で mpiblast ジョブを実行しています。これらは通常、約 10 個の異なるノードに配置され、ノードは通常ユーザー間で共有されます。これらのジョブは場合によってはかなりうまくスケーリングされ、使用可能なコアの約 90% を効果的に使用できますが、多くの場合、ジョブは使用可能なコアの約 10% に対応する CPU 時間しか蓄積しないため、スケーリングは非常に悪くなります。

一般的に、mpiblast のスケーリングを改善する必要がありますか? スケーリングの低下につながる可能性のある要因を知っている人はいますか?

0 投票する
1 に答える
742 参照

python - ブラスト ヒットのサブセットを位置に応じて連結して、完全なヒットを得る

私は biopython を使用して 、ヒットの位置で rps-blast の結果を並べ替えますが、ローカルヒットを結合または連結して、連続したクエリとサブジェクトヒットを取得したいと考えています。

私のコード:

これにより、次のようにソートされた結果が得られます。

これで問題ありませんが、次の論理的なステップに進みたいと思います。つまり、ここに示す 3 つの sub_queries とサブヒットをすべて連結して (ヒットの数は異なります)、完全なクエリとサブジェクトのシーケンスを取得します。今後の方向性は?

0 投票する
2 に答える
2084 参照

python - 短いヌクレオチド配列の Biopython blast パラメータ

NCBIWWW を使用して biopython で blastn を実行しようとしています。
特定のサンプル ファイルで qblast 関数を使用しています。
私はいくつかのメソッドを定義しており、fasta に十分な長さのシーケンスが含まれている場合、すべてが魅力的に機能します。失敗する唯一のケースは、短すぎるイルミナ シーケンスからの読み取りを爆破する必要がある場合です。ということは、作品提出時に爆破パラメータの自動再定義がないことが原因ではないかと思います。

私はブラスト・ショートの条件に近づけるためにできる限りのことを試みました (ここの表 C2 を参照)。

正しいパラメーターを入力できないようです。

私が作業状況に近づいたと思うのは、次のとおりです。

それを機能させるためのヒント/アドバイスをありがとう。

私のサンプル fasta read は次のとおりです。

私が得るエラーは次のとおりです。

そして、このページを見ると、私の問題はしきい値の修正にあるようですが、明らかにこれまでのところ機能させることができませんでした.

助けてくれてありがとう。

0 投票する
2 に答える
240 参照

python - NCBI BLASTp からの解析テーブル

PCA (主成分分析) の準備を整えるために、2 列のファイルを 0 と 1 のテーブルに変換したいと考えています。入力ファイルは、最初の列の細菌名と 2 番目の列の細菌記述子で構成されます。

考えられる方法: 入力ファイルをハッシュに保存し、各列で何らかの「uniq」コマンドを実行して、それらを出力ファイルに追加します。最後に、出力ファイルの組み合わせごとに、細菌名と記述子がファイル 1 ハッシュにある場合は 0 または 1 を追加します。

入力ファイル (タブ区切り):

目的の出力 (タブ区切り):

0 投票する
1 に答える
863 参照

python-3.x - Biopython NCBIWWW.qblast テスト ファイル - ハングする

NCBIWWW.qblast オンライン検索用に Biopython から提供されたテスト ファイルを実行しようとすると、応答しなくなります。NCBIWWW.qblast を含むスクリプトを自分で実行しようとすると、同じことが起こります。この行に到着して停止します。エラーメッセージは発行されず、結果は受信されず、プロセスは決して終了しません。

問題を引き起こすスクリプトの 1 つが次のスクリプトです。

何が問題になる可能性がありますか?

0 投票する
1 に答える
454 参照

r - R で BLAST SRA 関数を使用する

私は R 初心者ですが、R のコマンド ラインから NCBI BLAST の SRA 機能を制御できますか? NCBI の Web サイトは信頼性が低いことで有名であり、ファイルのバッチを管理できるようにしたいと考えています。