問題タブ [biopython]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2022 参照

alignment - Biopython でのペアワイズ シーケンス アラインメント

Biopythonでペアワイズ配列アラインメントを行うには? このサンプルコードを入手できますか?

0 投票する
1 に答える
201 参照

python - プログラムを Python スクリプトに埋め込む

ユーザーが DNA のねじれ、回転、位置などの情報を入力できるプログラムを作成しました。出力は PDB ファイルですが、プログラム内の .pdb ビューアーで .pdb ファイルを表示したいのですが、方法がわからないようです。希望するアプリケーションは Chimera(http://www.cgl.ucsf.edu/chimera/) または swiss(http://spdbv.vital-it.ch/) です。

0 投票する
1 に答える
431 参照

python - Python で文字列から複数の部分文字列を見つける方法

たとえば、文字列 'ATGAGGGATAGAGGGTTGGGAGAGATGGATAGGGGATAGATTG' がある場合、 ATG と TTG の間の部分文字列を取得する必要があります。文字列にはこれらの種類が 2 つあります。

とにかくそれを行う方法がわかりません。助けてください!

0 投票する
4 に答える
233 参照

python - 特定の部分文字列のみを選択する方法

文字列から dna = 'ATAGGGATAGGGAGAGAGCGATCGAGCTAG' と言う dna.format = 'ATAGGGATAG','GGGAGAGAG' と言う部分文字列を取得した モジュロを使用していますが、機能していません!

修正されたコード

これでも、長さが 3 で割り切れる部分文字列は得られません。. 何が間違っているのですか?

印刷される長さが3で割り切れる部分文字列のみを期待しています

0 投票する
1 に答える
1377 参照

python - DNA 検索シーケンスの正規表現における複数の不一致

この野蛮なスクリプトを作成して、文字列内の位置の可能なすべての組み合わせで n (最大 n=4) の $ を含む文字列の順列を作成しました。私は最終的に.replace('$','(\\w)')DNA検索シーケンスのミスマッチに使用します。スクリプトの書き方が原因で、一部の順列の $ の数は要求された数よりも少なくなっています。次に、それらを削除するスクリプトを作成しましたが、効果がないようで、削除スクリプトを実行するたびに、不要な順列がさらに削除されます。以下に貼り付けたコードでは、4 つの不一致がある単純なシーケンスで関数をテストしていることがわかります。次に、毎回削除される式の数をカウントする一連の削除スクリプトを実行します...私の経験では、ワイルドカード $ が 4 つ未満のすべての式を削除するには、約 8 回かかります。これについていくつか質問があります。

  1. 「n」個の不一致がある検索用の組み込み関数はありますか? 多分biopythonでも?これまでのところ、Paul_McGuire_regex 関数を見てきました:
    文字列の任意の場所で 1 つの不一致を許可する文字列を検索します
    これは、1 つの不一致しか生成しないようです。私は非常に新しいコーダーであるため、そのページの残りの関数のすべてのコードを完全に理解していないことを認めなければなりません。

  2. これは自分にとって良い練習になると思うので、このスクリプト全体を書くためのより良い方法はありますか?...Paul_McGuire_regex 関数を必要な回数だけ繰り返すことはできますか?

  3. 私にとって最も困惑しているのは、削除スクリプトが初めて 100% 機能しないのはなぜですか?

ご協力いただきありがとうございます。

0 投票する
1 に答える
227 参照

python - Python を使用して不足しているシーケンスを取得する -「分割」コマンドが機能しない

ソフトウェアを使用して発見された (タンパク質) 配列のセットがありますが、データベース内の元の配列よりも長さが短くなっています。データベース全体をダウンロードしました。発見され、配列が発見された元のデータベース。

ソフトウェアからの結果の例:

データベース内のシーケンス:

つまり、欠落している残基は「ARR」であり、最後に「EIP」です。このような不完全なシーケンスが約 70 ありますか? データベースから完全なシーケンスを自動的に取得できる Python プログラムを作成したいと思います。私はPythonに本当に慣れていません。もちろん、自分のコードを書いてみます。これを実行できるライブラリやbiopythonモジュールのようなものがあるかどうか知りたいです。私の計画は、結果から間隔を取得し、それらを展開して元のデータベースで選択することですが、さらに先に進む方法がわかりません。

list_seq = [ARR,KEFIMAELIQTEKAYVRDLRECMDTYLWEMTSGVE,EIP]さらに使用できるようlist_seq[0] r.strip(3)list_seq[1] l.strip[3]、完全なシーケンスを取得したいと思います。しかし、list_seq は機能しません。

前もって感謝します

0 投票する
2 に答える
529 参照

python - 次の10文字でPythonでさまざまな文字列の繰り返しを見つける

したがって、最初の文字列に遭遇した後、さまざまな文字列の繰り返しを見つけなければならないという問題に取り組んでいます。たとえば、ACTGACを使用して、データファイルに次のようなシーケンスが含まれているとします。

AAACTGACACCATCGATCAGAACCTGA

したがって、ACTGACが見つかったら、その文字列で次の10文字を分析して、いくつかのルールに従って文字列が繰り返されるかどうかを分析する必要があります。ルールをコーディングしましたが、必要な文字列を見つけたら、次の10文字のサブ文字列を作成して分析する方法を誰かに教えてもらえますか。文字列を見つけると、str.partition関数がそれを実行できることを知っています。その後、[1:10]は次の10文字を取得できます。

ありがとう!

0 投票する
1 に答える
1408 参照

python - Biopython エラー - 指定されたファイルが見つかりません

解決できないエラーが発生しました。

データベース (file -> cucumber.fasta としても指定) でシーケンス (「pytanie.fasta」ファイルとして指定されたシーケンス) を探して、tBLASTn アルゴリズムを実行する最も簡単な一連のコマンドを実行しようとしています。結果は「wynik.txt」ファイルに保存されます。

コードは次のようになります。

そして、私が得るエラー:

私は使っている:

  • Eclipse SDK バージョン: 3.7.1
  • Python バージョン 2.7
  • OS: 64 ビット Windows 7

32 ビット Windows XP でもこれを試しましたが、同じエラーが発生します。Biopython パッケージは、biopython Web サイトによって提案されたテストを通過したため、正常に動作するはずです。ファイルが配置されているパスの他の形式も試しましたが、うまくいきませんでした。私の友人は Ubuntu で同じコードを使用しており、正常に動作します。

このエラーを修正する方法を知っている人はいますか?

0 投票する
1 に答える
3198 参照

python - biopythonを使用してgbファイルからデータを抽出します

私はgbファイルを持っており、ファイルからいくつかの特定の機能を抽出する必要があります:タンパク質コーディング遺伝子の名前とサイズ。

seqFeatureとsubfeaturesを使用しましたが、機能しませんでした。

このファイルから取得する必要があります(ND1と2729..3685、ND2と3889..4932、...もっとあった場合)

私はbiopythonを初めて使用するので、これを行う方法についてサポートが必要です。