問題タブ [ncbi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - データベースからデータを取得する関数のエラー
NCBI Web サイトから FASTA ファイルを取得しようとしています。次の関数を使用します。
シーケンスを取得しようとすると
getSequence(query2$req[[1]]) のエラー: オブジェクト 'query2' が見つかりません
これらのループ機能も短縮するより良い方法はありますか?
私が使用する場合
別のエラーが表示されます
query("queryname", "thequery") のエラー: 無効な要求:"(^) の不明なリスト: \"(^)thequery\""
python - Bio.Entrez の efetch() は、PubMed 記事のすべてのメタデータを取得しますか?
PMID を入力として指定すると、 Bio.Entrezefetch()
が PubMed 記事のすべてのメタデータを取得するかどうか疑問に思います。efetch()
すべてのメタデータとは、PubMed が取得したものよりも多くのメタデータを持っているかどうかを意味します。
たとえば、 PMID については、 PubMed の Web サイト ( http://www.ncbi.nlm.nih.gov/pubmed/23954024 )の要約よりも少し少ない情報を含む要約を取得する23954024
ことがわかります。efetch()
efetch()
:
http://www.ncbi.nlm.nih.gov/pubmed/23954024 : 要約 目的: 回旋腱板腱障害は、一定割合の患者にとって持続性および/または再発性の問題を特徴とする肩痛の一般的な原因です。この研究の目的は、回旋腱板腱障害に対する通常の理学療法治療と比較して、自己管理負荷運動プログラムの有効性を評価するための実質的な研究を実施するために提案された方法をパイロットすることでした。
( 、OBJECTIVES
、DESIGN
などがの要約SETTING
から欠落しています。)efetch()
不足している他のメタデータは何efetch()
ですか? また、不足している情報をプログラムで取得する方法はありますか?
r - rentrez から公開された検索を関連性で並べ替えます
R のrentrezパッケージを使用して PubMed を検索しており、関連性で並べ替えられた結果を取得したいと考えています。現在、発行日順に並んでいます。
python - Pythonのfastaヘッダーの対応するGI番号からNCBIからアクセッション番号を取得します
Genbank で GI 番号を段階的に廃止し、次の形式でヘッダーを編集した場所にいくつかの fasta ファイルが保存されているという警告が表示され続けます。
どこから始めればよいかわかりませんが、理想的にはPythonを使用して、NCBIから各giに対応するアクセッション番号を取得し、次のようにヘッダー付きのファイルを出力できる方法はありますか?
ファイル形式の別の例を次に示します。
編集/更新:
python - NCBITaxa のロード中にクラッシュする
私はしばらくの間、非常に強力なサーバーで ete2 モジュールを使用してきました。非常にゆっくりと (1 分間に 1 つの関数) 進み始めるまではすべて問題ありませんでしたが、今では割り当てget_taxid_translator()
を通過することさえできません。ncbi = NCBITaxa()
anaconda2 をアンインストールして再インストールし、ete3 に更新しようとしました。「開発サーバー」ではncbi = NCBITaxa()
すべて正常に動作しますが、通常のサーバーではどのソフトウェアでも一線を越えられません。次のスクリプトでも終了しません
これは他の誰かに起こりましたか?依存関係をダウングレードする必要がありますか? 権限の問題でしょうか?基本的なスクリプトを実行すると、ctrl+c も ctrl+z もスクリプトをエスケープせず、スクリプトを強制終了するために使用する必要がkill -9 <job-id>
あります。待機時間が長すぎると、プロセスが中断できないスリープ状態になります。
前もってありがとう、アレクシス。
Python 2.7.12 :: Anaconda カスタム (64 ビット) gcc (GCC) 5.4.0
java - Pubmed は無効な XML 結果を返しますか?
私はJEUtilsを使用して Java で Pubmed の結果を取得および解析しています (これは放棄されたように見えるツールです)。
数日前から、このツールは一部の結果で例外をスローしており、調べてみると、Pubmed は独自のDTD ( DTD ページの最初のもの) を尊重していないようです。
たとえば、この記事では、XML 結果を Format: XML で表示するか、ここで直接参照できます。次の要素が含まれています。
ただし、DTD によると、これらの要素には少なくとも 1 つのネストされた要素が必要です。
質問: 何かが足りないのでしょうか、それとも Pubmed が独自の DTD に準拠しない結果 XML を作成しているのでしょうか?
r - 出力を行列に保存するループ
NCBI SRA データベースにアクセスし、ID のリストをクエリして、出力をマトリックスに保存しようとしています。
これを行うために Bioconductor の sradb パッケージを使用していますが、データベースにアクセスしてクエリを実行できるようになりましたが、非常に遅く、ループ出力を保存する方法がわかりませんでした。
ファイル GPL11154_GSMs.txt には、私が興味を持っている ID が含まれています。これは次のようになります。
私が今持っているものは、反復ごとに結果を更新します。