問題タブ [biopython]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - awk 、 python 、または biopython を使用して PDB ファイルからサブユニットの数を取得するにはどうすればよいですか?
ディレクトリにあるPDB(テキスト)ファイルがあります。各 PDB ファイルからサブユニットの数を出力したいと思います。
- で始まる pdb ファイル内のすべての行を読み取ります。
ATOM
- 行の 5 列目には、、、などが含まれ
ATOM
ます。A
B
C
D
A
サブユニットの数だけが含まれている場合は 1 です。とが含まA
れてB
いる場合は、サブユニットA
の数は 2 です。B
C
1kg2.pdb ファイル
1uz3.pdb ファイル
2b69.pdb ファイル
希望の出力
awk、python、またはBiopythonでこれを行うにはどうすればよいですか?
python - Biopython でオンラインで BLAST を実行すると構文エラーが発生する
Biopython チュートリアルとクックブック (第 7 章)に従って、パイロシーケンシングの fasta ファイルをヌクレオチド GenBank データベースと比較するスクリプトを作成しようとしています。
プロセスの実行中、プロンプトに次のメッセージが表示されます。
そして、私は問題が何であるか、またはそれを修正する方法を知りません。スクリプトに後でエラーが発生する可能性があります。しかし今、私はそれで歩き続けることができません。
biopython - Biopython ファイルが見つかりません
Python プロンプトから qblast を実行しようとしていますが、必要なすべてのライブラリをインポートした後、Python でファイルが見つかりません。
ファイルのすべてのルート (「/Users/imac...」) を書き留めて、ファイルを Python フォルダーと Biopython フォルダーに移動しようとしましたが、同じメッセージが表示されます。
ファイルをどこに保存すればよいですか? 私は何を間違っていますか?
python - Python や R で 3 文字のアミノ酸コードを 1 文字のコードに変換するにはどうすればよいですか?
以下に示すように、fastaファイルがあります。3文字のコードを1文字のコードに変換したいと思います。PythonまたはRでこれを行うにはどうすればよいですか?
希望の出力
あなたの提案をいただければ幸いです!!
python - コマンドラインのオプション引数
だから私はまだコーディングしていて、これがすべてうまくいくかどうかさえわかりませんが、実行することさえできないときにテストするのは難しいです. 複数のオプションの入力を試みるのはこれが初めてで、実行するたびにエラーが発生します:
「コマンド ライン引数エラー: 引数 "query"。ファイルにアクセスできません: `sequence_filename'」
コマンド ライン入力はファイル名 (require)、関数が実行するオプションの出力ファイル、prot (タンパク質の場合はデフォルト) または核酸の場合は na のオプション変数です。
前もって感謝します。
biopython - Bio.Entrez.Parser.ValidationError: DTD でタグ 'Build' が見つかりませんでした
Biopython をインストールしたばかりで、その機能を試してみたかったので、チュートリアルを開始しました。
しかし、Entrez から情報を取得する章に到達したとき、問題が発生しました。
チュートリアルの例は単純です。
これはうまくいきます。しかし、pubmed とは異なるデータベースを解析しようとするとすぐに、次のエラーが発生します。
validate=False オプションを試しても、Bio.Entrez.Parser.NotXMLError が発生するため、機能しません。
誰かが私が間違っていたことと、この問題をどのように解決できるか教えてもらえますか?
python - Pythonでオープンリーディングフレームを見つける方法
Pythonと正規表現を使用してORF
(オープンリーディングフレーム)を見つけています。
ATGC
次のような文字のみ(スペースや新しい行は含まない)で構成される文字列のサブ文字列を検索します。
で始まり、またはまたはATG
で終わり、最初の文字、2番目、3番目のシーケンスを考慮する必要があります。TAG
TAA
TGA
私が試したこと:
開始コドンを確認してから最初の終止コドンを見つける方法を見つけるにはどうすればよいですか。続いて、次の開始コドンと次の停止コドンを見つけます。
これを3フレーム実行したいと思います。前述のように、3つのフレームは、シーケンスの1番目、2番目、および3番目の文字を開始と見なします。
また、シーケンスは3の小さな部分に分割する必要があります。そのため、次のようなものが必要です。
どんな助けでもありがたいです。
私の最終的な答え:
上記の書き込み機能は、コンテンツをテキストファイルに書き込むのに役立ちません。私がそこに入るのはNONEだけです..なぜこのエラー..誰かが助けることができますか?
python - Biopython (Python) を使用して FASTA ファイルから配列を抽出する
わかりましたので、Python (biopython、http://biopython.org/DIST/docs/tutorial/Tutorial.html) を使用して、FASTA ファイルからシーケンスの一部を抽出する必要があります。
各配列から最初の 10 塩基を取得し、それらを 1 つのファイルに入れ、FASTA 形式の配列情報を保持する必要があります。最悪の場合、配列情報を保持する方法がない場合は、塩基を使用することもできます. 次に例を示します。
最初の 10 塩基を取得する何らかの方法が必要です (そして、最後の 10 塩基に対して再度実行することを計画していました)。そのチュートリアルサイトはかなり徹底していますが、私はこれに慣れていません。これには触れていないので、可能かどうかさえわかりません. ご協力いただきありがとうございます。
python - BioSQL データベースで bioentry レコードをクローンするにはどうすればよいですか
あるサブ データベースから別のサブ データベースにレコードを完全に複製する必要があります。ルックアップをロードに直接プラグインすることはできないようです。ファイルに書き込んで再度読み込むことはできますが、これはかなり洗練されていないようです。
これに対する重要な質問は次のとおりです。DBSeqRecord を従来の SeqRecord に完全にロードする簡単な方法はありますか?
どうもありがとう!
python - python/biopython を使用して混合 fasta ファイルを翻訳する
だから私は、データベースから一連の配列を取得し、それらを fasta ファイルにダウンロードするプログラムを持っています。問題は、これらの配列がタンパク質であるか、DNAである可能性があることです。大きな fasta ファイルを多くの小さな fasta ファイルに分割しています。配列を取得したら、それらをすべてタンパク質にする必要があります。だから私はそれがタンパク質であるかどうかを確認するためにそれぞれをテストしたい.
それらがすべてタンパク質である場合、私は大丈夫です。それらがすべてDNAである場合、それらすべてを翻訳するエレガントな方法がありますが、新しいfastaファイルをそれぞれテストし、翻訳し、翻訳する方法を見つける必要があります. DNAファイルを置き換える
これが私がこれまでに持っているものです:
私はそれを文字列に設定しようとしましたが(私は思う)、アルファベットを使用することはできません.fastaがフォーマットされている方法ではないため、他の多くのことを試しました. とにかく、助けていただければ幸いです。
よく知らない人のために説明すると、fasta ファイルは次の形式です。