問題タブ [ncbi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
formatting - 複数のコンティグを NCBI の ptt (タンパク質テーブル) 形式で表現する方法
多数のコンティグを持つアセンブリがあり、別のプログラムでは *.ptt (タンパク質テーブル) 形式のタンパク質が必要です。これまでに見たすべての例には染色体が 1 つしか含まれていないように見えるため、たとえば 10 位で始まり 1000 位で終わる 2 つの異なるコンティグ上の 2 つの遺伝子が、これらの異なるコンティグに属していると認識されるようにするにはどうすればよいでしょうか (これらは両方とも同じスタット/ストップ位置を持っています)?
コンティグごとに新しいヘッダーを追加する必要がありますか? これはフォーマットでサポートされていますか?
ありがとう、ロッディ
python - 短いヌクレオチド配列の Biopython blast パラメータ
NCBIWWW を使用して biopython で blastn を実行しようとしています。
特定のサンプル ファイルで qblast 関数を使用しています。
私はいくつかのメソッドを定義しており、fasta に十分な長さのシーケンスが含まれている場合、すべてが魅力的に機能します。失敗する唯一のケースは、短すぎるイルミナ シーケンスからの読み取りを爆破する必要がある場合です。ということは、作品提出時に爆破パラメータの自動再定義がないことが原因ではないかと思います。
私はブラスト・ショートの条件に近づけるためにできる限りのことを試みました (ここの表 C2 を参照)。
正しいパラメーターを入力できないようです。
私が作業状況に近づいたと思うのは、次のとおりです。
それを機能させるためのヒント/アドバイスをありがとう。
私のサンプル fasta read は次のとおりです。
私が得るエラーは次のとおりです。
そして、このページを見ると、私の問題はしきい値の修正にあるようですが、明らかにこれまでのところ機能させることができませんでした.
助けてくれてありがとう。
database - Perl を使用して NCBI から FASTA ヌクレオチド形式で遺伝子の特徴を取得するにはどうすればよいですか?
次のような FASTA ファイルを手動でダウンロードできます。
「Send to」をクリックして「Gene Features」を選択すると、このページで FASTA Nucleotide が唯一のオプションになります (これで十分です) 。
次のようなスクリプトを使用します。
次のようなファイルを取得します。
ゲノム配列全体がひとまとめにされています。最初の (手動でダウンロードした) ファイルのような情報を取得するにはどうすればよいですか?
私は他のいくつかの投稿を見ました:
- biopython entrez.esearch で完全なゲノム配列をダウンロードする方法(この回答は関連があるようです)
- アクセッション番号だけで GenBank ファイル全体をダウンロードするにはどうすればよいですか?
EUtilities Cookbook のこのセクションと同様に。
GenBank ファイルを取得して保存しようとしましたが (取得した .gb ファイル内の遺伝子ごとに個別の配列があるように見えるため)、Bio::SeqIO を使用して作業すると、大きな配列が 1 つしか取得されません。
bioinformatics - Biojava または Biopython を使用して、一部の生物の全ゲノム genbank ファイルを取得する
BIopython または BioJAVA を使用して、FTP ncbi から gbk ファイルを自動的に検索および解析する方法を知っている人はいますか。BIOjava でユーティリティを検索しましたが、見つかりませんでした。私もBioPythonを試しましたが、これが私のコードです:
ただし、マイコバクテリウム アビウム種は 3 つしかありません (全ゲノム シーケンスと完全な注釈付き)。得られた結果は 59897 です。
BioJava または BioPython で検索を実行する方法を教えてください。それ以外の場合は、このプロセスを最初から自動化する必要があります。
ありがとうございました。
python-3.x - Biopython NCBIWWW.qblast テスト ファイル - ハングする
NCBIWWW.qblast オンライン検索用に Biopython から提供されたテスト ファイルを実行しようとすると、応答しなくなります。NCBIWWW.qblast を含むスクリプトを自分で実行しようとすると、同じことが起こります。この行に到着して停止します。エラーメッセージは発行されず、結果は受信されず、プロセスは決して終了しません。
問題を引き起こすスクリプトの 1 つが次のスクリプトです。
何が問題になる可能性がありますか?
r - R で BLAST SRA 関数を使用する
私は R 初心者ですが、R のコマンド ラインから NCBI BLAST の SRA 機能を制御できますか? NCBI の Web サイトは信頼性が低いことで有名であり、ファイルのバッチを管理できるようにしたいと考えています。
xml - qblast xml 出力からの個々のヒット遺伝子情報
Biopython を使い始めたばかりで、qblast()
関数を使用してリモート BLAST 操作を実行しようとしています。すべてが正常に機能しているように見えますが、重要な出力結果を取得できません。NCBI Web ページから BLAST を実行すると、各ヒットの "Features" フィールドが表示されます。これは、特定のヒット サブジェクトの、クエリ ヌクレオチド シーケンスに割り当てられた遺伝子を示します。ただし、 からの出力 XML ファイルを解析qblast
すると、これに対応するフィールドが表示されません。XML ファイルを BLAST 出力から直接エクスポートしましたが、そこにもありません。
このような重要な情報がこの出力ファイルから完全に欠落している可能性はありますか? この情報にアクセスする別の方法はありますか、または出力ファイルをテキスト形式で解析することによってのみアクセスできますか?
c++ - NCBI c++ ツールキットの使用に問題がある
私は小さなプログラムを実装してブラストを実行し、ブラウザーなしで結果を取得しようとしています。ncbi c++ ツールキットは私が探しているもののように思えますが、それを使用する際に問題が発生しました。
私の環境は、MSVC 2010 c++ コンパイラと QT フレームワークを備えた Windows です。次の手順に従って、ツールキットをダウンロード、構成、およびビルドしました。
http://www.ncbi.nlm.nih.gov/books/NBK7167/
以下のディレクトリにすべてのライブラリ (.*lib ファイル) があります。
ncbi_cxx--12_0_0\compilers\msvc1000_prj\dll\lib\ReleaseDLL
以下はncbiが提供する例です。私は同様のことをしようとしています。 http://www.ncbi.nlm.nih.gov/IEB/ToolBox/CPP_DOC/lxr/source/src/sample/app/blast/remote_blast_demo.cpp
すべての準備ができたら、(Qt Creator を使用して) プロジェクトを作成し、ツールキットを使用してみます。ただし、たとえば、ヘッダーファイルのいずれかを含めると問題が発生します
ncbi ライブラリをインクルードするときのコンパイラ エラーを解決する方法がわかりません。エラー メッセージは次のとおりです。
'ncbi::CUtf8::AsUTF8' デフォルト パラメーターの再定義: パラメーター 2 (ncbistr.hpp 行 2861)
'ncbi::CStringUTF8 ncbi::CUtf8::AsUTF8(const ncbi::TCharUCS2*,ncbi::SIZE_TYPE)' : メンバー関数は既に定義または宣言されています (ncbistr.hpp 行 2861)
'ncbi::CUtf8::AsUTF8': パラメーター 2 の既定のパラメーターがありません (ncbistr.hpp 行 2861)
私はこのツールキットの使い方を考えるのに何日も費やしました。
ところで、プロジェクト ファイルにはパスとライブラリを含めます。
php - 複数のリダイレクトがあるページをクロールする最良の方法
NCBI Web サイトをクロールして、このリンクで利用可能なタンパク質のローカル アラインメントのリクエストを送信します: http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=blastp&PAGE_TYPE=BlastSearch
PHP を使用して、このアドレスに投稿リクエストを送信し、新しいページに表示される結果を取得できるかどうかを知りたいです。最終結果が表示される前に、ページが複数のリダイレクトを受けるという問題もあります。テキスト領域に入力する次の入力を使用して、この状況をテストできます。
これが私の試みです:
このコードは、POST が行われていないかのように、最初のページを取得します。ありがとう
アップデート
私は以下の提案の1つを試しました - Goutte.
これが私の新しいコードです:
変数$aaTest
は、上で示したタンパク質配列です。良い点は、投稿して新しいページを取得しますが、すべてのリダイレクトをたどらないことです。すべてのリダイレクトに従うようにするにはどうすればよいですか?
html - perl の LWP で Web ページを読む - 出力がダウンロードした html ページと異なる
http://www.ncbi.nlm.nih.gov/nuccore/NM_000036などの NCBI の別のページにアクセスして使用しようとしていますが、
perl の LWP::Simple 'get' 関数を使用すると、同じ結果が得られません。ページを手動で保存したときに得られる出力(Firefoxブラウザーの「htmlとして保存」オプションを使用)。「get」関数から得たものには、必要なデータがありません。
私は何か間違ったことをしていますか?別のツールを使用する必要がありますか?
私のスクリプトは次のとおりです。
前もって感謝します!