問題タブ [blast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - Blast+: blastdbcmd - エラー メッセージ
16S Microbial データベース形式を fasta 形式に変換したい。Blast+ プログラム (2.2.27+ バージョン Window) を使用しています。このプログラムをインストールでき、blastdbcmd コマンドを使用する必要があることがわかりました。問題は、コマンドを正しく記述する方法がわからないことと、次のエラー メッセージが表示 されることです。検索パス C:users\Debora\blast-2.2.27+ にヌクレオチド データベース 16SMicrobial が見つかりませんでした。 ; C:users\Debora\blast-2.2.27+\db\16SMicrobial
16S Microbial ファイルは db ファイルにあります。16S 微生物は解凍され、解凍されます。
環境変数を編集しようとしました。ユーザー変数とシステム変数を編集するつもりでしたが、何を書かなければならないのかよくわかりません。したがって、データベースが間違った場所にあると思われますが、修正方法がわかりません。
誰かが私を助けてくれることを願っています!!!!!
全てに感謝!!!
python - NCBIXML を使用して BLAST 出力から上位 3 ヒットのみを解析する
BLAST XML 出力から必要な情報を解析するために、以下のようにコードを変更しました。
このコードにより、E 値をカットオフしてヒットを解析できました。しかし、BLAST 出力ファイルのサイズが大きいため、BLAST XML 出力からのベスト ヒットまたは上位 3 ヒットのみを解析したいと考えています。
すべてのヒット結果を解析すると、処理に時間がかかり、実際にはすべてのヒット結果は必要ありません。
誰か親切に私を助けてくれませんか?
python - デスクトップを Web アプリケーションに移植する (バイオインフォマティクス)
Windows OS 用に作成したいくつかのバイオインフォマティクス プログラムを Web アプリケーションに移植したいと考えています。BLAST、Bowtie、Primer3 などのバイオインフォマティクス パッケージをいくつか使用しています。これらの外部ツールは通常、ユーザーが提供するファイルを取得して処理し、解析して表示する出力ファイルを作成します。さらに、これらのツールは、ユーザーが作成して再利用する特定のデータベースを使用しています。
今までは、ツールで作成したデータベース(ファイルもユーザー提供)と出力結果をソフトウェアをインストールしたPCに保存していました。現在、Web サーバーでこのような設定を処理する方法がわかりません。世界中のユーザーが作成したすべてのデータベースを保存することはできませんが、同時にデータベースを毎回作成し直すのは非常に面倒です (たとえば、ヒトゲノムデータベースは 2.7 GB であり、作成に時間がかかります)。ユーザーが戻ってきます (1 人のユーザーがツールごとに約 5 ~ 10 のデータベースを作成すると思います。私は 3 つのツールを持っています: 1 MB ~ 50 GB)。
この問題を Web アプリでどのように解決できますか?
編集 より明確にするために、ユーザーが作成したデータを再利用するためのより洗練された方法があるかどうかを知りたいだけです。セッションのためにこれらのファイルを一時的に保存することを考えていました。これらのツールは非常に特殊であり、私は多くのユーザーを持っていないため、課金を求める可能性はありません. さらに、ほとんどのユーザーは親しい同僚です。何年にもわたってさまざまな OS と格闘し、プログラムのデバッグと保守を行ってきましたが、最終的にはあきらめました (私はプライベートな時間にこれを行っています)。単純に時間がかかるだけです (さらに、Linux、Android、および IOS についていくつか要求があります)。
ありがとう
linux - マルチスレッド プログラムの Linux time コマンドの結果の解釈 (%CPU > 100)
サーバーでBLASTの実行時間をベンチマークしたいので、time
コマンドを開始しました。サーバーには 16 個の CPU があり、BLAST 16 スレッドを実行していました。私の分析が行われている間、他のアプリケーションが並行して実行されていた可能性があります。
出力は次のとおりです。
ユーザー時間を、CPU がアプリケーションの実行に費やした秒数として解釈すると、合計時間よりも長くなります。時間を %CPU で割るべきだと人々が言うのを見てきましたが、3 分しか得られず、BLAST とそれに入れたサイズの入力には非現実的です。
必要な情報はユーザー時間ですが、それを解釈する方法がわかりません。
結果の解釈について何か提案はありますか?
bash - スクリプト内で for ループが機能しない
blastx を実行するスクリプトを bash で作成しました。
次に、4 つのジョブを barrine サーバーに送信します。私が取得することになっているのは、これを含む 4 つのジョブです。
しかし、スクリプトで得たのは次のとおりです。
誰かが問題を解決するのを手伝ってくれますか? スクリプトの外側で for ループを使用すると、正常に動作します。
手伝ってくれてありがとう
python - 同じ仕様の 2 つの異なるマシンで同じプログラムを実行すると異なる出力が得られる理由
bio-python と blast を使用する python プログラムがあり、コマンドラインを受け入れます。Centos 5.3 final でこのプログラムを実行します。問題は、同じアプリケーションと同じオペレーティングシステムを知っているのとまったく同じ2つの異なるマシンでこれを持っていることですが、そのうちの1つでコマンドを実行した後、正しくない出力ファイルとして「a.data」のようなものを取得します。もう1つは、正しい出力である「a.data.bak」、「a.data.dat」、「a.data.dir」として3つのファイルを取得します。
ここで何が起こっているのか、なぜ同じマシンの同じコードから異なる出力が得られるのか分かりますか?
bioinformatics - blast データベース名から fasta ソース ファイルを取得する
私は現在-outfmt 10
、Blast のオプションを使用するライブラリを作成しています。これにより、かなり人間が読める形式ではなく、CSV が得られます。
お気に入り
問題は、処理後にいくつかのシーケンスを抽出できるように、db ソース ファイルにアクセスしたいということです。これを行う方法を知っている唯一の方法は、remove を使用し-outfmt 10
て blast を 2 回実行することです。次に、次の行の人間が読める形式の出力を解析します。
ただし、 でtitle
データベースを作成するときに が指定されていない場合にのみ機能しますmakeblastdb
。stitle
とにかく、 ofoutfmt 10
は fasta ヘッダー行のようです。.fna, .fas, .faa
ソースファイルとは異なる名前をデータベースに付けることができるため、データベース名と a だけを探すことはできません。
blast データベース名から fasta ソース ファイルを抽出する別の方法はありますか? outfmt
オプションのリストに何も表示されません。それとも今日は盲目ですか?
blast - ローカル BLAST Swissprot データベース エラー
私のマシン (Mac) でスタンドアロンの ncbi-blast-2.2.28+ を実行しようとしていますが、SwissProt データベースで blastp を実行すると、次のエラー メッセージが表示されます。
ここで私がしたこと:
1) ncbi サーバーから「ncbi-blast-2.2.28+-universal-macosx.tar.gz」をダウンロードして解凍
2) フォルダーの bin コンテンツを $PATH ディレクトリ "/Users/me/bin" に移動します。
3) "/Users/me/bin" に "db" フォルダーと、次のパスを含む ".ncbirc" ファイルを作成しました。
4) SwissProt データベースをダウンロードし、「/Users/me/bin/db/」に次のファイルを取得しました。
次に、次のコマンドを使用して、任意の作業ディレクトリ (クエリ ファイルがある場所) から blastp を実行すると、次のようになります。
次のエラー メッセージが表示されます。
他のスレッドで読んだように、コマンドラインでデータベースが配置されているパス全体を言及し、ファイル名から .pal 拡張子を削除しようとしました。しかし、まだ機能しません。
誰かが私が間違ったことを見ることができますか?!!!!