問題タブ [biopython]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1556 参照

python - Biopython の calc_dihedral() が 3 つの二面角をすべて計算するために必要な原子はどれですか?

剰余の 3 つの二面角をすべて計算したいと思います。

calc_dihedral(atom1, atom2, atom3, atom4)of Biopython は、引数として 4 つの原子のベクトル座標を必要とし、単一の値の出力を返します。出力が 3 つの角度のどれを表しているかわかりません。

残基内のどの原子がどの角度を計算するのに必要で、どの順序で原子座標が引数として関数に与えられるべきかを提案してください。

0 投票する
3 に答える
1230 参照

python - Pythonで開きたいファイルのパス指定の仕方がわかりません

私は Python の初心者で、genbank および fasta 形式のファイルをインポートしようとしました。彼らのドキュメントでは、データセットを Python にインポートする方法を示す例を提供しています。具体的には、Biopython チュートリアルとクックブックの 16 ページで次の例を提供しています。

現在、彼らは 14 ページで、Biopython のソース コードにこのファイルが含まれていると述べていますが、これは事実です。しかし、Python は Bio import SeqIO を介して、ファイルが正確にどこにあるかをどのように知るのでしょうか? biopython とそのコンポーネントをインストールした後に上記のコードを試してみましたが、うまくいきませんでしたか?

また、genbank ファイルのパスを指定して、何とか開くことはできますか?

ありがとうございました

0 投票する
1 に答える
2211 参照

python - Python で FASTA から Blast データベースを作成する

これどうやってするの?私はBiopythonを使用しており、すでにマニュアルを見ました。もちろん、スタンドアロンの NCBI BLAST+ で「makeblastdb」を使用して FASTA から blastdb を作成することもできますが、すべてのプロセスを 1 つのプログラムで実行したいと考えています。

2つの解決策が考えられるようです。

  1. このジョブを実行する関数を見つけます。

    私はこれを見つけることができません。私は一日中過ごしました。

  2. Python で「makeblastdb」を実行します。

    Python シェルで os.system("C:\blast-2.2.25+\bin\makeblastdb.exe") を入力しましたが、パラメーターを指定できませんでした。

どうすればこれを解決できますか? ご協力ありがとうございます。

0 投票する
1 に答える
208 参照

python - GenBank レコードのシーケンスを変更するには?

私がやりたいことは、GenBank レコードのすべての非推定シーケンスをゲノム ファイルで小文字にすることです。

これまでのところ、gbk 内のタンパク質の開始位置と終了位置を取得することができました。そこから、次のことを行います。

これで、ゲノム内の配列の開始位置と終了位置がわかりました。しかし、ゲノムファイルをどのように変更すればよいのでしょうか? gb_record.seq[start:end].lower()または同様の何かがうまくいきませんでした。

を割り当てるgb_record.seq = gb_record.seq[start:end].lowerと、ゲノムファイルを置き換えるので、明らかにうまくいきません。何か案は?

0 投票する
3 に答える
999 参照

python - Biopython(または一般的にはPythonのみ):gi識別子を使用して大きな.fastaファイルから種名を解析する最も効率的な方法

私は以下のようにフォーマットされた約145000エントリの.fastaファイル(本質的に.txt)を持っています

  1. 私はgiのリストを持っています(|の後にリストされている最初の番号)。
  2. このリストのサイズは、特定のテストで60〜600giの間で変化します
  3. それらのギのそれぞれの種のリストを返したい
  4. 種名は通常、最初の例(角かっこ[Mus musculus]で囲まれています)のように表示されますが、常に存在するとは限りません。
  5. 順序は特に重要ではありません。

私はさまざまなBioPython解析ビットを使用してきましたが、検索のサイズが原因で失敗すると思います。私はここの誰かがもっと効率的な方法を知っていることを望んでいましたか?

前もって感謝します!

0 投票する
1 に答える
2708 参照

alignment - Python スクリプトからの Blast Two シーケンス

タンパク質のペアのリストがあり、「BLAST Two Sequences」の速度と精度を、アライメント用の Smith-Waterman プログラムと比較したいと考えています。NCBI Web サイトに「Blast Two Sequences」オプションがあることは知っていますが、python スクリプトから実行したいと思います。おそらくBiopythonにはこの機能がありますか?Blast Two Sequences を使用できない場合は、Smith-Waterman のさまざまなバージョンを比較しますが、これはそれほどエキサイティングではありません :) または、タンパク質のペアを比較するバイオインフォマティクスの優れた 4 年生プロジェクトについて別のアイデアがある場合は、お願いします遠慮なくお知らせください!よろしくお願いします。

0 投票する
1 に答える
324 参照

parsing - これは有効な Genbank 機能の説明ですか、それとも Biopython のバグですか?

次のようなネストされた機能を含む Genbank 形式のファイル (最小限のダミーの例としてここに示されています) を偶然見つけました。

このような機能は、現在の Biopython Genbank パーサー (1.59 リリース) をクラッシュさせますが、以前のリリース (1.55 など) ではクラッシュしなかったようです。どうやら、この動作は 1.57 で既に行われていたようです (以下のコメントを参照)。

Biopython バグトラッカーによると、古い locationparser コードは 1.56 で削除されたようです。

ftp://ftp.ncbi.nih.gov/genbank/gbrel.txtおよびhttp://www.insdc.org/documents/feature_table.html#3.4.2の形式の説明から推測できることから、これが最もおそらく無効です。(ただし、以下のコメントを参照してください)。

誰かがこれについてコメントできますか。つまり、これは Biopython または Genbank ファイルの形式の不具合ですか?

完全なデモ ファイル:

エラーを表示するための最小限のデモ プログラム (Biopython 1.59 と Python 2.7 がインストールされており、上記のファイルが "test.gb" として利用可能であると仮定します。

これはでクラッシュします

0 投票する
3 に答える
997 参照

python-3.x - biopython に fasta ファイルからシーケンスを読み取らせ、構造予測のために RNAfold への入力として割り当てる方法は?

fasta ファイル (約 1000 シーケンス) から各シーケンスを読み取り、それぞれを二次構造予測用の別のアプリケーション (RNAfold) への入力として使用するプログラムが必要です。私はパイソンを使用しています。出来ますか?誰かが開始のガイドラインコードを教えてくれませんか?

@Lennart私はコードを以下のものに変更しました:

$

そして、RNAfold の出力とは関係のない次の出力が得られます。コードの何が問題なのですか?

0 投票する
2 に答える
215 参照

python - ppmap/parallel python に隠れたデッドロックの可能性はありますか?

マップの並列バージョン ( ppmapラッパー、Kirk Strauser による実装) の使用に問題があります。

私が並行して実行しようとしている関数は、BioPython の SeqIO を使用してファイルシステムから解析された多数の文字列 (タンパク質シーケンス) に対して単純な正規表現検索を実行します。各関数呼び出しは、独自のファイルを使用します。

法線マップを使用して関数を実行すると、すべてが期待どおりに機能します。ただし、ppmap を使用すると、実行の一部が単純にフリーズし、CPU の使用率がなくなり、メイン プログラムが KeyboardInterrupt に反応しなくなります。また、実行中のプロセスを見ると、ワーカーはまだ存在しています (ただし、CPU は使用されていません)。

例えば

さらに、ワーカーは特定のデータ エントリでフリーズしているようには見えません。手動でプロセスを強制終了して実行を再実行すると、別の時点で停止します。(そのため、一時的に終了したエントリのリストを保持することに頼り、プログラムを複数回再起動しました)。

問題がどこにあるかを確認する方法はありますか?

私が実行しているコードのサンプル:

ppmap の代わりに単純なマップを使用すると、すべて正常に動作します。

0 投票する
2 に答える
318 参照

indentation - Biopython インデント エラー

私は約 1 年間 biopython に手を出しており、最近 Biopython リリース 1.59 にアップグレードしました。いくつかのチュートリアルでスキルを更新していますが、for ループと biopython ライブラリのモジュールを実行すると、常に以下のエラーが発生します。

コマンド ライン ターミナルから Komodo Edit バージョン 7.0.2 で記述された .py ファイルを呼び出した場合にのみ、このエラーが発生します。

コマンド ラインを使用して、上記のように 1 年前に作成した古い .py ファイルを呼び出すと、正常に動作します。Python を直接起動し、チュートリアルの例を 1 行ずつ入力すると、正常に動作します。

端末から実行できるように .py ファイルを修正するにはどうすればよいですか?

この問題についての洞察をいただければ幸いです。

プリヤ