問題タブ [blast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - NCBI c++ ツールキットの使用に問題がある
私は小さなプログラムを実装してブラストを実行し、ブラウザーなしで結果を取得しようとしています。ncbi c++ ツールキットは私が探しているもののように思えますが、それを使用する際に問題が発生しました。
私の環境は、MSVC 2010 c++ コンパイラと QT フレームワークを備えた Windows です。次の手順に従って、ツールキットをダウンロード、構成、およびビルドしました。
http://www.ncbi.nlm.nih.gov/books/NBK7167/
以下のディレクトリにすべてのライブラリ (.*lib ファイル) があります。
ncbi_cxx--12_0_0\compilers\msvc1000_prj\dll\lib\ReleaseDLL
以下はncbiが提供する例です。私は同様のことをしようとしています。 http://www.ncbi.nlm.nih.gov/IEB/ToolBox/CPP_DOC/lxr/source/src/sample/app/blast/remote_blast_demo.cpp
すべての準備ができたら、(Qt Creator を使用して) プロジェクトを作成し、ツールキットを使用してみます。ただし、たとえば、ヘッダーファイルのいずれかを含めると問題が発生します
ncbi ライブラリをインクルードするときのコンパイラ エラーを解決する方法がわかりません。エラー メッセージは次のとおりです。
'ncbi::CUtf8::AsUTF8' デフォルト パラメーターの再定義: パラメーター 2 (ncbistr.hpp 行 2861)
'ncbi::CStringUTF8 ncbi::CUtf8::AsUTF8(const ncbi::TCharUCS2*,ncbi::SIZE_TYPE)' : メンバー関数は既に定義または宣言されています (ncbistr.hpp 行 2861)
'ncbi::CUtf8::AsUTF8': パラメーター 2 の既定のパラメーターがありません (ncbistr.hpp 行 2861)
私はこのツールキットの使い方を考えるのに何日も費やしました。
ところで、プロジェクト ファイルにはパスとライブラリを含めます。
perl - NCBI スタンドアロン BLAST でステータス更新を取得するには?
たとえば、リモート (NCBI) サーバーを使用して、何千もの EST シーケンスに対してスタンドアロンの Blast+ を実行しています。15 of 100 シーケンスが実行されているなどのステータス メッセージが表示されません。そのようなステータスメッセージを取得することは可能ですか? または、perl スクリプトを使用して次々とシーケンスを送信する他の方法はありますか?
どうもありがとう!
python - PythonでBLAST出力列をCSV形式で抽出する
BLAST検索からの出力を次の形式で含むExcelのcsvファイルがあります。
これをcsvとしてPythonにインポートしました
私が今できるようにしたいのは、データの列をリストとして抽出することです。私の全体的な目標は、98% を超える一致 (3 列目) を持つすべての一致をカウントすることです。
問題は、これは典型的な csv 形式ではないため、上部にヘッダーがないため、ヘッダーに基づいて列を抽出できないことです。3番目の列をリストとして抽出できれば、Pythonの通常のリストツールを使用して必要な数値だけを抽出できると考えていましたが、pythons csvモジュールを使用したことがなく、適切なコマンドを見つけるのに苦労しています. SOに関する他の質問は似ていますが、ヘッダーや空のセルがないという私の特定のケースについては言及しないでください。あなたが私を助けることができれば、私はとても感謝しています!
python-2.7 - Biopython blastn コマンドがスクリプトで機能しないが、コマンド ラインからは機能する
そのため、ブラスト クエリを実行するスクリプトを作成しています。この時点で変数をハードコーディングしました (混乱しないようにするためだけです)。それは次のとおりです。
そして、何も得られず、出力ファイルは空白で、エラーも何もありません。コマンド ラインで blastCLine から blast コマンドを使用すると、機能します。Python環境で上記のコードを使用すると、動作します。私のスクリプトでは機能しません。
私はグーグルでたくさんの例を見てきました。私が言えることから、それはうまくいくはずです。私はそれをblastxに変更しようとしましたが、cmd="blastn"を使用しても無駄でした。助言がありますか?
python - Python を使用して BLAST 出力を csv 形式で読み取ると、インデックス エラーが発生する
長い質問で申し訳ありません。私はこのバグを解決しようとしてきましたが、何が間違っているのかわかりません! データの例を含めたので、私が何を扱っているかがわかります。
以下のように、BLAST検索からデータ出力があります。
これをcsvとして保存しました。これも以下に示します
私はパーセンテージ ID を調べる短いスクリプトを設計しました。それがしきい値を超えている場合は、queryID を見つけて、リストから重複を削除する前にリストに追加します。
ほとんどの場合、スクリプトは完全に機能しますが、以下に示すエラーが頻繁に発生します
しかし、スクリプトを変更して印刷line[2]
すると、期待どおりにすべての ID が印刷されます。何がうまくいかないのか分かりますか?データの壁について再度お詫び申し上げます。
これは私の以前の質問から部分的に取られました: Extracting BLAST output columns in CSV form with python
bash - 複数のデータベースを個別にブラストする
私はバイオインフォマティクスが初めてです。200 以上のゲノムでタンパク質のリスト (クエリ) を見つけようとしています。各ゲノムの結果を別々に取得したい。bash スクリプトを作成しようとしましたが、うまくいきません。
一度に 2 つの tblastn インスタンスのみを実行したいと考えています。このコードは、200 を超える tblastn インスタンスを実行します。database_names.txt には、データベースの名前と場所が含まれています。
database_names.txt の最初の 3 行を次に示します。
ここにエラーメッセージがあります
output - ターゲット領域内またはターゲット領域外の BLAST マッチを検出するには
そこで、ターゲット シーケンス サイトから DNA シーケンスの一部を取得し、それを使用してゲノムを攻撃します。次に、ブラスト結果の出力から、ターゲット サイトに一致するだけでなく、他の地域からの一致シーケンスがあるかどうかを知りたいです。BLAST出力から知る方法は? ゲノム部位の指標はありますか?ありがとう