問題タブ [ncbi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
129 参照

python - biopython で genbank ファイルをダウンロード中に socket.gaierror が発生する

Biopython とアクセッション番号のリストを使用して、NCBI から genbank ファイルをダウンロードしたいと思います (引数として電子メール アドレスを使用してスクリプトを呼び出すことに注意してください。たとえば、python scriptName.py emailAddress)。

スクリプトを実行すると、エラーが発生する前に、最初のファイル (のみ) の部分的なダウンロードが行われます。

コードにエラーがあるかどうか、選択したモジュールに問題があるかどうか (Biopython が呼び出しを処理する必要がありますが)、接続に問題があるかどうか (警告なしにジョブがブロックされてスロットルされるかどうか) をまだ判断していません。 )、またはそれ以外の場合。

urllib*/http* モジュールを使用して、または使用せずに実行しようとしましたが、役に立ちませんでした (同じエラーが発生します)。ただし、部分ファイルは興味深いものです。最終シーケンスまでのすべてがダウンロードされます (最後にコンティグ エントリがあります)。ダウンロードしたファイルの最後の行は次のとおりです。

これは元の genbank ファイルと比較できます: http://www.ncbi.nlm.nih.gov/nuccore/10955266/?report=genbank

DTD ファイルに関連するエラーではないことは確認できましたが、それ以外は問題ありません。( NCBI からの新しい RefSeq リリースは Bio.Entrez.Parser と互換性がありますか? )

このスクリプトを CentOS Python 3.4.3 で実行しています :: Anaconda 2.3.0 (64-bit) :: Biopython 1.66

0 投票する
2 に答える
1366 参照

ftp - ncbi から複数の fasta ファイルをダウンロードする

1 つの生物に関連付けられているすべての fasta ファイルを ncbi からダウンロードしようとしています。

wget -r -l3 -A "*.fna.gz" ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/Microcystis_aeruginosa/3 番目のレベルから .fna.gz で終わるすべてのファイルを取得しようとしましたが、次の出力ですべてが拒否されます。

「ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/Microcystis_aeruginosa/latest_assembly_versions/.listing」を削除。「GCF_000010625.1_ASM1062v1」を拒否します。「GCF_000307995.1_ASM30799v2」を拒否します。「GCF_000312165.1_ASM31216v1」を拒否します。「GCF_000312185.1_ASM31218v1」を拒否します。「GCF_000312205.1_ASM31220v1」を拒否します。「GCF_000312225.1_ASM31222v1」を拒否します。「GCF_000312245.1_ASM31224v1」を拒否します。「GCF_000312265.1_ASM31226v1」を拒否します。「GCF_000312285.1_ASM31228v1」を拒否します。「GCF_000312725.1_ASM31272v1」を拒否します。「GCF_000330925.1_MicAerT1.0」を拒否します。「GCF_000332585.1_MicAerD1.0」を拒否します。「GCF_000412595.1_spc777-v1」を拒否します。「GCF_000599945.1_Mic70051.0」を拒否します。「GCF_000787675.1_ASM78767v1」を却下。「GCF_000981785.1_ASM98178v1」を拒否します。

これらのディレクトリを拒否する理由について何か考えはありますか? ご協力いただきありがとうございます。

0 投票する
3 に答える
3512 参照

bioinformatics - タクシーから王国、門、綱、目、科、属、種の分類固有のIDを取得する方法は?

次のようなタクシーのリストがあります。

上記のタクシーから順番に分類IDを含むファイルを取得しようとしています:

パッケージ「ete3」を使用しています。上記の ID からリネージを教えてくれるツールete-ncbiqueryを使用します。(以下のコマンドを使用してLinuxラップトップから実行します)

結果は次のようになります。

探しているものに対応するアイテム (IDS) がわかりません (存在する場合)

0 投票する
1 に答える
400 参照

python - biopython を使用して一度に複数のデータベースを検索できますか

私の仕事は、NCBI の E-Utilties を使用して、Crispr/Cas9 システムに関して過去 10 年間に提出された論文の数を取得することです。一度に複数のデータベースを検索するにはどうすればよいですか? これまでの私のコード:

0 投票する
1 に答える
351 参照

python - Python で複数のアクセッション番号から ncbi から対応する fasta タンパク質配列を返すにはどうすればよいですか?

Python スクリプトを使用して、複数のアクセッション番号の fasta 配列をテキスト ファイルにダウンロードするのに苦労しています。単一のアクセッション番号でこれを実行できます。例:

しかし、ファイルをリストとして指定しようとすると (以下を参照)、エラーが発生します。

入力ファイルがどのように見えるかの例を次に示します。

解決策は簡単だと思いますが、フォーラム、ncbi ヘルプページ、初心者向けの Python の本を何時間も読んでいますが、どこにも行き着きません! 前もって感謝します。

0 投票する
3 に答える
2095 参照

perl - -e 行 1 の未定義の値に対してメソッド「login」を呼び出すことはできません

これは私が得たエラーです。ncbi という Web サイトから一連のコマンドを直接コピーして貼り付けました。

これらのコマンドに慣れていないため、何を探すべきかわかりません

編集ウェブサイトの誰かによっていくつかのことが修正されましたが、まだ入力しようとしています

空白行が発生するだけなので、「cat」と入力しただけのようなものです。