“biopython”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1513 参照

python - Biopython は Python 3.2 をサポートしていますか?

Biopython の Web サイトには、バージョン 2.7 までの Python が必要であると記載されていますが、Python 3+ のサポートが存在するかどうかは明示されていません。

Python 3.2 で Biopython を使用する方法はありますか?

参照: http://biopython.org/DIST/docs/install/Installation.html#sec7

python biopython

2012-05-05T17:21:36.287

0 投票する

2 に答える

244 参照

bioinformatics - MultipleSeqAlignment オブジェクトの印刷

によって生成された3つのシーケンスのアラインメントがありますclustalx

Biopython で定義済みのインデックス付けを使用してアライメントをスライスできますalign[:,:4]

ただし、結果を印刷すると、次のようになります。

以下に示すように、名前を出力せずにサブアラインメントをキャプチャするにはどうすればよいですか?

align[:,:4].seq探している出力が得られません。

2012-05-08T09:39:32.993

0 投票する

2 に答える

2612 参照

python - Biopython ローカル BLAST データベースエラー

Biopython の NcbiblastxCommandline ツールを使用して「nr」データベースで blastx をローカルで実行しようとしていますが、タンパク質データベースの検索パスに関して常に次のエラーが発生します。

ダウンロードした nr データベースを指すようにパスを変更する方法がわかりませんが、このコードをコマンドラインから問題なく実行できるため、パスを正しく指していると思いました。

上記のコマンドラインコードは、予想どおり、ブラスト結果の xml ファイルを作成します。

Biopython NCBI コマンドラインツールを使用してこの問題を解決するための助けをいただければ幸いです。

python database path biopython blast

2012-05-21T05:10:23.697

0 投票する

1 に答える

875 参照

biopython - Bio.PDB からのインポート時の ImportError

Biopython の PDBParser を使用して PDB ファイルをダウンロードしたいのですが、インポートしようとすると次のエラーが表示されます。

トレースバック (最新の呼び出しが最後): File "C:\Python27\TAREA 3 FINAL.PY", line 33, in [HTML] from Bio.PDB import * File "C:\Python27\lib\site-packages\Bio\ PDB_init_.py"、15 行目、[HTML] from PDBParser import PDBParser File "C:\Python27\lib\site-packages\Bio\PDB\PDBParser.py"、13 行目、[HTML] import numpy ImportError: No numpy という名前のモジュール

何が起きてる？

biopython

2012-05-25T14:01:21.950

0 投票する

3 に答える

537 参照

python-2.7 - Biopython のインストールにヘルプが必要

Mac OS 10.6 があり、python バージョン 2.7 32 ビットがインストールされており、numpy と scipy も含まれています。xcodeバージョン3.2もあります。この時点で何をすべきか本当に混乱しています。biopython バージョン 1.59 をダウンロードし、セットアップコードを python で実行しようとしましたが、動作しません。私は何が欠けていますか？

セットアップファイルをアイドル状態で実行しようとすると、次のエラーメッセージが表示されます。

python-2.7 biopython

2012-05-26T21:40:18.940

0 投票する

1 に答える

192 参照

python - Biopython の PDB モジュールに等価性を実装する

バックグラウンド

BiopythonのPDBモジュールでは、PDB 構造がオブジェクトに解析されStructure、SMCRA アーキテクチャ (Structure/Model/Chain/Residue/Atom) に構造のコンポーネントが格納されます。Entityこの階層の各レベルは、コンテナクラスを継承するオブジェクトによって表されます。

等価

私の問題は、2 つの Entity オブジェクトが等しくなることは決してないということです。

同じファイルから構築された構造は等しくありません。

その構造内の残基は等しくありません:

等々。

同じ PDB ファイルを個別に解析した場合Entity、構造内のどのオブジェクトも等しいとは言えません。

解決

この問題の明らかな解決策は、同じ PDB ファイルを 2 回解析しないことです。次に、オブジェクトの同一性、つまり等価性があります。ただし、この答えは私には不完全に思えます。

各Entityオブジェクトは、を使用して識別タプルを返すことができますget_full_id()。このメソッドは、最上位のオブジェクトから順にすべての ID を提供します。Entityオブジェクトの構築時に適切な PDB ID が指定されている場合は、構造内の各構造体で一意である必要があり、すべての構造体で一意である必要がありStructureます。

Entity同等性をテストするための私の解決策は、単にこの完全な ID を比較することです。あれは：

質問

Entityこの時点で、同等性の実装が適切かどうかを尋ねています。

誤検知 (たとえば、同じ PDB ID が提供された異なる構造) は心配ですか?
同等性をテストする必要があるときはいつでも、完全な ID を手動で比較する方がよいでしょうか?
また、モジュール__eq__内で実装されていない理由はありますか?PDB

python biopython

2012-05-29T15:25:31.713

0 投票する

1 に答える

865 参照

python - 大きなfastaを複数のファイルに分割し、GI番号で名前を付けることはできません

私は、Python と Biopython の両方に慣れていないということから始めなければなりません。大きな .fasta ファイル (複数のエントリを持つ) を、それぞれに 1 つのエントリを持つ単一のファイルに分割しようとしています。Biopython wiki/Cookbook サイトで次のコードのほとんどを見つけ、少しだけ変更しました。私の問題は、このジェネレーターがそれらに「1.fasta」、「2.fasta」などの名前を付けていることです。GI番号などの識別子で名前を付ける必要があります。

交換しようとすると：

と：

SeqIO の seq_record.id に似た名前になるようにすると、次のエラーが発生します。

ジェネレーター関数には属性「id」がありませんが、どうにか回避できますか? このスクリプトは、私がやろうとしていることに対して複雑すぎますか?!? ありがとう、チャールズ

python biopython fasta

2012-05-30T15:46:33.470

0 投票する

2 に答える

1173 参照

python - （BioPython）MemoryError：Out of Memory例外を停止するにはどうすればよいですか？

非常に大きな複数のシーケンスファイルのペア（それぞれ平均約1000 bpの長さの>77,000シーケンス）を取得し、ペアになっている個々の要素間のアラインメントスコアを計算し、その番号を出力ファイルに書き込むプログラムがあります（これをロードします）。後でExcelファイル）。

私のコードは小さな複数のシーケンスファイルで機能しますが、大きなマスターファイルは16番目のペアを分析した後に次のトレースバックをスローします。

私はこれを回避するために多くのことを試みましたが（多くの人がコードからわかるように）、まったく役に立ちませんでした。大きなマスターファイルを小さなバッチに分割して、スコア計算方法にフィードしてみました。使い終わった後、delファイルを試しました。Oracle仮想マシンでUbuntu 11.11を使ってみました（通常、64ビットのWindows 7で動作します）。私は野心的であり、これはBioPythonで計算上実行可能ですか？以下は私のコードです。この問題の明らかな原因であるメモリデバッグの経験はありません。私はこの問題に非常に不満を感じています。

最高、ハリー

PS親切にしてください私はこの問題を回避するためにそこに置いたコードにおそらくいくつかの間抜けなものがあることを知っています。

python memory out-of-memory bioinformatics biopython

2012-05-31T20:01:09.877

0 投票する

1 に答える

1111 参照

biopython - Entrez.efetch(db="Taxonomy", id=tax_id, retmode="xml") returns empty records

The following code returns an empty record:

biopython

2012-06-01T11:41:53.090

0 投票する

2 に答える

973 参照

parsing - Excel の ID リストを使用して、NCBI から配列を fasta 形式で保存します。

私はPythonを使用するのはかなり初めてで、大好きです。しかし、私はこの問題で立ち往生しており、私が見逃しているものについて教えていただければ幸いです.

Excel ファイルに遺伝子 ID のリストがあり、xrld と biopython を使用してシーケンスを取得し、(fasta 形式で) 結果をテキストドキュメントに保存しようとしています。これまでのところ、私のコードではシェルで結果を確認できますが、ドキュメントの最後のシーケンスしか保存されません。

これは私のコードです:

前述したように、ファイル「example.txt」には、シェルを示す最後のシーケンス (fasta 形式) しかありません。

同じドキュメントで NCBI から取得したすべてのシーケンスを取得する方法を教えてください。

どうもありがとうございました

アントニオ

parsing bioinformatics biopython

2012-06-02T21:09:45.303

問題タブ [biopython]

バックグラウンド

等価

解決

質問

Reference