問題タブ [biopython]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
429 参照

python - BioPython: Entrez.esummary/Entrez.read で不正な GID をスキップする

変なタイトルでごめんなさい。

eSearch と eSummary を使用して移動しています

アクセッション番号 --> gID --> TaxID

「accessions」が 20 の登録番号のリストであると仮定します (NCBI が許可する最大値であるため、一度に 20 とします)。

そうです:

これにより、これらの 20 のアクセッション番号から 20 の対応する GID が得られます。

に続く:

gids の GID の 1 つが NCBI から削除されているため、このエラーが発生します。

私は試すことができます:, except: それ以外は、問題のない他の 19 個の GID をスキップします。

私の質問は:

Entrez.read を使用して一度に 20 レコードを読み取り、他の 20 レコードを犠牲にすることなく、欠落しているレコードをスキップするにはどうすればよいですか? 一度に 1 つずつ実行できますが、それは信じられないほど遅くなります (私は 300,000 のアクセッション番号を持っており、NCBI では 1 秒あたり 3 つのクエリしか実行できませんが、実際には 1 秒あたり 1 つのクエリのようです)。

0 投票する
2 に答える
8331 参照

bioinformatics - BioPython で BLAST クエリを実行する

私はしたいと思います

  1. BLAST いくつかのシーケンス
  2. 各クエリから上位 100 件程度のヒットを取得する
  3. ダウンロードした配列をプールする
  4. 重複を削除

BioPython でこれを行うにはどうすればよいですか?

0 投票する
4 に答える
2467 参照

bioinformatics - multiFASTAファイル処理

multiFASTAファイルを処理して、配列の数、長さ、ヌクレオチド/アミノ酸の含有量などの情報を取得し、説明的なプロットを自動的に描画できるバイオインフォマティクスツールがあるかどうか知りたいと思いました。R BIoconductorソリューションまたはBioPerlモジュールでもかまいませんが、何も見つかりませんでした。

手伝って頂けますか?どうもありがとう :-)

0 投票する
4 に答える
1399 参照

python - サブプロセスは標準出力をキャッチできません

fastaファイル入力とMuscleCommandlineとのアライメントでツリーを生成しようとしています

私はいつもこれらの問題に遭遇します

0 投票する
2 に答える
179 参照

parsing - Clustal を使用して各行から 50 シーケンスを出力します

複数配列アラインメント (Clustal) ファイルがあり、このファイルを読み込んで、順序がより明確で正確に見えるように配列を配置したいと考えています。

オブジェクトを使用してBiopythonからこれを行っていAlignIOます:

私の出力は、乱雑で長いスクロールに見えます。私がやりたいことは、各行に 50 シーケンスのみを出力し、アライメント ファイルの最後まで続けることです。

http://www.ebi.ac.uk/Tools/clustalw2/から、このような出力が必要です。

0 投票する
4 に答える
4780 参照

python - Pythonでゲノム配列を効率的に取得しますか?

Pythonを使用してゲノム配列を効率的にフェッチするにはどうすればよいですか?たとえば、.faファイルやその他の簡単に入手できる形式からですか?基本的に、指定されたストランドの指定された染色体上のシーケンス[start、end]を返すインターフェイスfetch_seq(chrom、strand、start、end)が必要です。

同様に、phastConsスコアを取得するためのプログラムによるPythonインターフェースはありますか?

ありがとう。

0 投票する
3 に答える
9283 参照

python - Web から CGI スクリプトを実行しているときに、Python がいくつかのモジュールを見つけられないのはなぜですか?

ここで何が問題なのかわかりません:

対話型プロンプトを使用するとき、またはコマンドラインから Python スクリプトを実行するときに、簡単にインポートできる Biopython のモジュールがいくつかあります。

問題は、同じ biopython モジュールを Web 実行可能な CGI スクリプトにインポートしようとすると、「インポート エラー」が発生することです。

: Bio という名前のモジュールはありません

ここに何かアイデアはありますか?

0 投票する
1 に答える
4208 参照

python - Biopython へのラプラシアン平滑化

Bioinformatics プロジェクトの Biopython のナイーブ ベイズ コード1にラプラシアン スムージング サポートを追加しようとしています。

ナイーブ ベイズ アルゴリズムとラプラシアン スムージングに関する多くのドキュメントを読みましたが、基本的な考え方は理解できたと思いますが、これをそのコードと統合することはできません (実際、どの部分に 1 -ラプラシアン数を追加するかわかりません)。

私は Python に詳しくなく、初心者のコーダーです。Biopython に詳しい方からアドバイスをいただければ幸いです。

0 投票する
1 に答える
2529 参照

python - PhyloBioPython構築ツリー

BioPython、Phyloモジュールでツリーを構築しようとしています。
私がこれまでに行ったことは、この画像です。代替テキスト

各名前には、4桁の数字の後に-と数字が続きます。この数字は、そのシーケンスが表される回数を示します。つまり、1578-22、そのノードは22シーケンスを表す必要があります。

シーケンスが整列され たファイル:ツリーを構築する距離のファイルをファイルしますfile

これで、ノードの各サイズを変更する方法がわかりました。各ノードのサイズは異なります。これにより、さまざまな値の配列を簡単に作成できます。

しかし、配列は任意です。正しいノードサイズを正しいノードに配置したいので、これを試しました。

しかし、ifステートメントを使用しても何も表示されません。

とにかくこれを行う?

本当にありがたいです!

みんなありがとう