問題タブ [blast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R エラーの strsplit を使用した for ループ
この記事の冒頭で、私は R とバイオインフォマティクスのコーディングは初めてであり、この知識豊富なコミュニティからの意見をお待ちしております。以下に投稿されたコードの私の目標は、BLAST の結果からタンパク質ごとのアミノ酸存在量を示す円グラフを生成することです. UniProt から csv ファイルをアップロードし、それをマトリックスに変換して、以下のコードを書きました。エラーが発生し続けます: In AAs[i] = table(strsplit(BLAST_AA_seqs[i], "", useBytes = TRUE)) :number of items to replace is not a multiple of replacement length. 列 8 は、アミノ酸配列を含む出力列です。前もって感謝します!
biopython - Biopython NCBIWWW による BLAST。データベースの完全なリストはどこにありますか?
モジュール Biopython モジュール NCBIWWW を使用して、いくつかのシーケンスをオンラインで爆発させています。利用可能なさまざまなデータベースに対してシーケンスをブラストしたいのですが、それらの包括的なリストが見つかりません。
「blastn」アルゴリズムを使用した Nucleotide コレクション データベースへの単純なクエリの例を次に示します。
ご覧のとおり、データベースの Nucleotide コレクションは "nt" として指定されています。たとえば、Human GRCh37/hg19 データベースにクエリを実行する場合、「nt」を何に置き換えればよいでしょうか? そして、他の種/ビルドを照会したい場合は? http://blast.ncbi.nlm.nih.govで利用可能なすべてのデータベースの短い名前を見つけることができる包括的なリストはありますか?
ありがとう!
php - システムコマンドの出力を端末とまったく同じようにブラウザに表示する方法
php shell_exec を使用して BLAST コマンド (生物学的配列アラインメント ツール) を実行し、結果をbrowserに出力しました。ただし、ターミナルで同じコマンドを実行したときに表示される結果と同じようにフォーマットすることはできません。passthru() や exec() などのメソッドを使用してみました。どっちもダメ!私の場合、小さなスペースでエラーが発生する可能性があるため、出力の書式設定は重要です (一部を以下に示します)。ブラウザに結果を正確に表示する方法を教えてください 。
私の出力の一部は次のようになります。
python - エラー: function Input_stream::Input_stream(const string&, bool) 63 行目。ファイル @HWI-M02942_file1.fasta を開く際のエラー
BLAST プログラム DIAMOND を使用して BLAST を自動的に実行する Python スクリプトを作成しています。スクリプトは、Ubuntu 14.04 のターミナルでコマンドを実行します。
私のPythonスクリプトは次のとおりです。
スクリプトは、正しいファイル パスとファイル名を変数に割り当てた後、実行するコマンドを作成します。
このスクリプトを実行しようとすると、次のエラーが表示されます。
20行目に出力されたコマンドをターミナルで個別に実行すると、エラーは発生せず、BLASTアプリケーションの出力は正しいため、コマンドが正しいと確信しています。
ターミナルで個別にではなく、この Python スクリプトでコマンドを実行しているときにこのエラーが発生する理由と、このエラーを解決する方法を教えてください。
linux - Perl System() のネストされた引用符
perl スクリプトを変更しようとしています。変更しようとしている部分は次のとおりです。
オリジナル:
システム(「tblastn .....」)を次のものに置き換えようとしています:
これにより、通常の tblastx プログラムが、tblastx コマンドをパイプ処理する GNU 並列プログラムに置き換えられます。上記のコマンドを bash で実行すると (temp 入力を実際のファイルに置き換えて) は完全に機能しますが、perl スクリプトが実行しようとすると、エラー ログ (tblastx の場合) に、sseqids の後、すぐに終了したと表示されます。bash でエスケープ文字を使用せずに同じコマンドを実行すると、同じエラーが発生します。
このため、エラーは「7 ssequids sstart...」を囲む一重引用符が適切に解析されていないことが原因であると想定しています。perl でネストされた引用符を適切に行う方法がわかりません。それはbash経由では機能しますが、perlスクリプト経由では機能しないので、私はそれを正しくやっていると思いました。私はたくさんの perl ドキュメントを見ましたが、エスケープ文字 \ は引用符または二重引用符で動作するはずですが、私のインスタンスでは動作しません。
見積もりが処理されていない理由について誰かが意見を提供できますか?
bioinformatics - BLAST: blastpgp が出力ファイルを生成しない、データベース フラグを正しく使用しているかどうか不明
質問1:
私は以下を実行しています:
ここで、 protein.fasta は単一のタンパク質配列を含む fasta ファイルです。これは出力を生成せず、-o ファイルは空です。
質問2:
私は正常に使用できました:
データベースファイルを作成します。ただし、これにより複数のファイル、.phr、.pin、.psd、.psi、.psq が作成されました。自分のデータベースを使用するには、これらのどれを -d フラグで渡す必要がありますか?
ありがとうございました!
biopython - NCBIWWW を使用した BlastP からの出力が期待どおりではない
NCBIWWW を使用して、特定のタンパク質の blastP 結果を取得しようとしています。問題は、送り返されるのは、アライメント データとして認識されるものではなく、これが返されることです (これは、ソース コードの 'Blast_record' の内容です)。「BioPython チュートリアルとクックブック」から取得したコードを使用しています。それとインターネットでエラーの原因を探しましたが、見つかりません。私のソースコードはこれです;
結果のファイルは次のとおりです。
ここで、BlastN と上記で使用したタンパク質のヌクレオチド配列を使用して検索を実行すると、一致するすべての配列、それらの E 値、およびスコアなどが得られます。
私はPythonとBiopythonの両方に非常に慣れていません。私の人生では、何が間違っているのかわかりません。
python - TypeError: 'str' オブジェクトは呼び出し可能ではありません - データベースに入力するとき
BLAST を自動的に実行するスクリプトを作成し、データベースを自動で埋める必要があります。スクリプトがデータベースをいっぱいにしようとするまで、すべてうまくいきます。次に、次のエラーが表示されます。
データベースの入力に問題があることは知っていますが、何をどのように解決できるかわかりません。手伝ってくれませんか?これは私のコードです: