“biopython”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

436 参照

python - awk 、 python 、または biopython を使用して PDB ファイルからサブユニットの数を取得するにはどうすればよいですか?

ディレクトリにあるPDB（テキスト）ファイルがあります。各 PDB ファイルからサブユニットの数を出力したいと思います。

で始まる pdb ファイル内のすべての行を読み取ります。ATOM
行の 5 列目には、、、などが含まれATOMます。ABCD
Aサブユニットの数だけが含まれている場合は 1 です。とが含まAれてBいる場合は、サブユニットAの数は 2 です。BC

1kg2.pdb ファイル

1uz3.pdb ファイル

2b69.pdb ファイル

希望の出力

awk、python、またはBiopythonでこれを行うにはどうすればよいですか?

2012-09-15T00:59:04.660

0 投票する

1 に答える

309 参照

python - Biopython でオンラインで BLAST を実行すると構文エラーが発生する

Biopython チュートリアルとクックブック (第 7 章)に従って、パイロシーケンシングの fasta ファイルをヌクレオチド GenBank データベースと比較するスクリプトを作成しようとしています。

プロセスの実行中、プロンプトに次のメッセージが表示されます。

そして、私は問題が何であるか、またはそれを修正する方法を知りません。スクリプトに後でエラーが発生する可能性があります。しかし今、私はそれで歩き続けることができません。

python biopython blast

2012-09-17T08:01:18.603

0 投票する

1 に答える

204 参照

biopython - Biopython ファイルが見つかりません

Python プロンプトから qblast を実行しようとしていますが、必要なすべてのライブラリをインポートした後、Python でファイルが見つかりません。

ファイルのすべてのルート (「/Users/imac...」) を書き留めて、ファイルを Python フォルダーと Biopython フォルダーに移動しようとしましたが、同じメッセージが表示されます。

ファイルをどこに保存すればよいですか? 私は何を間違っていますか？

biopython blast

2012-09-17T10:22:46.260

0 投票する

11 に答える

19354 参照

python - Python や R で 3 文字のアミノ酸コードを 1 文字のコードに変換するにはどうすればよいですか?

以下に示すように、fastaファイルがあります。3文字のコードを1文字のコードに変換したいと思います。PythonまたはRでこれを行うにはどうすればよいですか?

希望の出力

あなたの提案をいただければ幸いです!!

python r bioinformatics biopython

2012-10-06T13:39:20.090

0 投票する

1 に答える

326 参照

python - コマンドラインのオプション引数

だから私はまだコーディングしていて、これがすべてうまくいくかどうかさえわかりませんが、実行することさえできないときにテストするのは難しいです. 複数のオプションの入力を試みるのはこれが初めてで、実行するたびにエラーが発生します：

「コマンドライン引数エラー: 引数 "query"。ファイルにアクセスできません: `sequence_filename'」

コマンドライン入力はファイル名 (require)、関数が実行するオプションの出力ファイル、prot (タンパク質の場合はデフォルト) または核酸の場合は na のオプション変数です。

前もって感謝します。

python command-line-arguments biopython sys

2012-10-16T18:12:55.167

0 投票する

2 に答える

660 参照

biopython - Bio.Entrez.Parser.ValidationError: DTD でタグ 'Build' が見つかりませんでした

Biopython をインストールしたばかりで、その機能を試してみたかったので、チュートリアルを開始しました。

しかし、Entrez から情報を取得する章に到達したとき、問題が発生しました。

チュートリアルの例は単純です。

これはうまくいきます。しかし、pubmed とは異なるデータベースを解析しようとするとすぐに、次のエラーが発生します。

validate=False オプションを試しても、Bio.Entrez.Parser.NotXMLError が発生するため、機能しません。

誰かが私が間違っていたことと、この問題をどのように解決できるか教えてもらえますか?

biopython

2012-10-18T07:56:24.993

0 投票する

3 に答える

26709 参照

python - Pythonでオープンリーディングフレームを見つける方法

Pythonと正規表現を使用してORF（オープンリーディングフレーム）を見つけています。

ATGC次のような文字のみ（スペースや新しい行は含まない）で構成される文字列のサブ文字列を検索します。

で始まり、またはまたはATGで終わり、最初の文字、2番目、3番目のシーケンスを考慮する必要があります。TAGTAATGA

私が試したこと：

開始コドンを確認してから最初の終止コドンを見つける方法を見つけるにはどうすればよいですか。続いて、次の開始コドンと次の停止コドンを見つけます。

これを3フレーム実行したいと思います。前述のように、3つのフレームは、シーケンスの1番目、2番目、および3番目の文字を開始と見なします。

また、シーケンスは3の小さな部分に分割する必要があります。そのため、次のようなものが必要です。

どんな助けでもありがたいです。

私の最終的な答え：

上記の書き込み機能は、コンテンツをテキストファイルに書き込むのに役立ちません。私がそこに入るのはNONEだけです..なぜこのエラー..誰かが助けることができますか？

python python-3.x python-2.7 biopython

2012-10-28T23:49:52.740

0 投票する

2 に答える

13803 参照

python - Biopython (Python) を使用して FASTA ファイルから配列を抽出する

わかりましたので、Python (biopython、http://biopython.org/DIST/docs/tutorial/Tutorial.html) を使用して、FASTA ファイルからシーケンスの一部を抽出する必要があります。

各配列から最初の 10 塩基を取得し、それらを 1 つのファイルに入れ、FASTA 形式の配列情報を保持する必要があります。最悪の場合、配列情報を保持する方法がない場合は、塩基を使用することもできます. 次に例を示します。

最初の 10 塩基を取得する何らかの方法が必要です (そして、最後の 10 塩基に対して再度実行することを計画していました)。そのチュートリアルサイトはかなり徹底していますが、私はこれに慣れていません。これには触れていないので、可能かどうかさえわかりません. ご協力いただきありがとうございます。

python python-2.7 biopython fasta

2012-10-30T03:29:07.957

0 投票する

0 に答える

74 参照

python - BioSQL データベースで bioentry レコードをクローンするにはどうすればよいですか

あるサブデータベースから別のサブデータベースにレコードを完全に複製する必要があります。ルックアップをロードに直接プラグインすることはできないようです。ファイルに書き込んで再度読み込むことはできますが、これはかなり洗練されていないようです。

これに対する重要な質問は次のとおりです。DBSeqRecord を従来の SeqRecord に完全にロードする簡単な方法はありますか?

どうもありがとう！

python biopython

2012-11-01T11:36:25.597

0 投票する

1 に答える

753 参照

python - python/biopython を使用して混合 fasta ファイルを翻訳する

だから私は、データベースから一連の配列を取得し、それらを fasta ファイルにダウンロードするプログラムを持っています。問題は、これらの配列がタンパク質であるか、DNAである可能性があることです。大きな fasta ファイルを多くの小さな fasta ファイルに分割しています。配列を取得したら、それらをすべてタンパク質にする必要があります。だから私はそれがタンパク質であるかどうかを確認するためにそれぞれをテストしたい.

それらがすべてタンパク質である場合、私は大丈夫です。それらがすべてDNAである場合、それらすべてを翻訳するエレガントな方法がありますが、新しいfastaファイルをそれぞれテストし、翻訳し、翻訳する方法を見つける必要があります. DNAファイルを置き換える

これが私がこれまでに持っているものです：

私はそれを文字列に設定しようとしましたが（私は思う）、アルファベットを使用することはできません.fastaがフォーマットされている方法ではないため、他の多くのことを試しました. とにかく、助けていただければ幸いです。

よく知らない人のために説明すると、fasta ファイルは次の形式です。

python biopython fasta

2012-11-01T15:13:49.827

問題タブ [biopython]

Reference