問題タブ [ncbi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 辞書の Python Entrez 辞書から値を返す
Entrez Gene ページから Interactions テーブルをスクレイピングしたいと考えています。
Interactions テーブルは Web サーバーから入力されます。R で XML パッケージを使用しようとすると、Entrez 遺伝子ページを取得できましたが、Interactions テーブルの本体は空でした (Web サーバーによって入力されていませんでした)。
R で Web サーバーの問題を処理することは解決可能かもしれません (そして、私はその方法を知りたいと思っています) が、Biopython の方がより簡単な方法のようでした。
以下をまとめました。これにより、遺伝子の例に必要なものが得られます。
このコードは機能し、私が望むものを与えてくれます。しかし、それは見苦しいと思いますし、Entrez の遺伝子ページのフォーマットがわずかに変更されると、コードが壊れてしまうのではないかと懸念しています。特に、私が行っているように、完全なパスを指定するよりも、必要な情報を抽出するためのより良い方法が必要です。
しかし、降りたい各レベルを指定せずに辞書の辞書を検索する方法がわかりません。find() のような関数を試してみると、それらは次のレベルで動作しますが、一番下までは動作しません。
ワイルドカード記号、「//」に相当する Python、またはフルパスを指定せずに ['Object-id_id'] に到達するために使用できる関数はありますか? よりクリーンなコードの提案も歓迎します。
biopython - Biopython NCBIWWW による BLAST。データベースの完全なリストはどこにありますか?
モジュール Biopython モジュール NCBIWWW を使用して、いくつかのシーケンスをオンラインで爆発させています。利用可能なさまざまなデータベースに対してシーケンスをブラストしたいのですが、それらの包括的なリストが見つかりません。
「blastn」アルゴリズムを使用した Nucleotide コレクション データベースへの単純なクエリの例を次に示します。
ご覧のとおり、データベースの Nucleotide コレクションは "nt" として指定されています。たとえば、Human GRCh37/hg19 データベースにクエリを実行する場合、「nt」を何に置き換えればよいでしょうか? そして、他の種/ビルドを照会したい場合は? http://blast.ncbi.nlm.nih.govで利用可能なすべてのデータベースの短い名前を見つけることができる包括的なリストはありますか?
ありがとう!
r - R リスト内の .attrs と反復エントリ
このRスクリプトを使用して、NCBIから情報を取得しようとしています:
結果を印刷すると、次のようなことがわかります。
このリストには多くの .attrs エントリがあり、多くの場合、繰り返します。次のような他の繰り返しエントリもあります。
等
.attrs の意味と、このデータをどのように理解すればよいですか? 1 つのリストに同じ名前の 2 つのエントリを含める方法がわかりません。
php - 複数の XML 結果を PHP に繰り返し解析する際のトラブル
NCBI (国立バイオテクノロジー情報センター) の E-utilities サービスを利用するための PHP スクリプトを作成しようとしています。
次のようなコードを使用して、URL に検索語 (この例では「alaS」) を指定し、問題なく XML 結果を取得できます。
これは正常に動作します (結果はhttp://djcamenares.x10.m/testing/parse1.phpで確認できます)
ただし、結果のリンクを取得しようとして、スクリプトに結果を取得させようとすると、何も得られません。これは次のコードです。
これは、http://djcamenares.x10.mx/testing/parse3.phpで入手できます。
助言がありますか?プログラム全体を構築するより良い方法でしょうか?変数/結果をこのユーティリティ サーバーと 3 回やり取りする必要があります (遺伝子 ID を検索するために 1 回、次に各遺伝子 ID をタンパク質 ID にリンクし、最後にタンパク質配列を取得するため)。
あらゆる助けに感謝します。この質問が冗長であるか、すでに回答されている場合は申し訳ありません。私はPHPに比較的慣れていません。
r - xpathApply:複数のパスまたはノードを渡す方法は?
すべてのレコードにアブストラクトがある場合、うまく機能します。ただし、PMID (#23733758) に公開された抄録 (または書籍の記事など) がない場合は、スキップされてエラーになります。'names' attribute [5] must be the same length as the vector [4]
Q: 複数のパス/ノードを渡して、雑誌の記事、書籍、またはレビューを抽出する方法を教えてください。
更新: hrbrmstr ソリューションは、NA に対処するのに役立ちます。しかし、xpathApply
のように複数のノードを取ることができc(//Abstract, //ReviewArticle , etc etc )
ますか?
xml - XMLファイルで異なる名前のサブノード(子)の値にアクセスするには?
xmlValue
NCBI xml ファイルから特定の子ノードを解析しようとしています。ただし、一部の PM.ID については、公開されたレコードとRoot node <PubmedArticleSet>
は異なる情報を持っています。条件を渡し、特定の値を抽出して他の値を抽出したいと思います。最後に、PMID に対応する両方の値を使用して を作成します。簡単に思えますが、エラーがスローされますPubmedBookArticle
PubmedArticle
if(xmlName(fetch.pubmed) == PubmedBookArticle
elseif (xmlName(fetch.pubmed) == PubmedArticle
dataframe
(xmlName(fetch.pubmed)
no applicable method for 'xmlName' applied to an object of class "c('XMLInternalDocument', 'XMLAbstractDocument')"
私のコードは以下です
各検索で条件が満たされたときに PubmedArticle と PubmedBookArticle 内の値を取得できるように、上記のコードをループで取得するにはどうすればよいですか?
ncbi - 公開データ ncbi からすべての要約データをダウンロードするにはどうすればよいですか?
公開されているすべてのデータ アブストラクトをダウンロードしたいと考えています。公開された記事の要約をすべて簡単にダウンロードする方法を知っている人はいますか?
データのソースを入手しました: ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/af/12/
とにかく、これらすべての tar ファイルをダウンロードする方法はありますか..
前もって感謝します。