問題タブ [protein-database]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3013 参照

python - Biopython PDB: 原子と点の間の距離を計算する

典型的な pdb ファイルを使用すると、Biopython のドキュメントに示されている方法と同様の方法を使用して、構造内の 2 つの原子間の距離を計算できます。ここに示されています:

原子からxyz座標の固定点までの距離を計算するBiopython内の方法はありますか? Biopython でない場合、この問題を解決する最善の方法は何でしょうか? ありがとう。

0 投票する
4 に答える
8141 参照

python - Python 正規表現を使用してパターン内でカットする

目的: Python RegEx でカットを実行しようとしていますが、分割では希望どおりの結果が得られません。パターン内でカットする必要がありますが、文字間です。

私が探しているもの:

以下の文字列のパターンを認識し、パイプの位置で文字列を分割する必要があります。パイプは実際には文字列にはありません。分割したい場所を示しているだけです。

パターン:CDE|FG

弦:ABCDEFGHIJKLMNOCDEFGZYPE

結果:['ABCDE', 'FGHIJKLMNOCDE', 'FGZYPE']

私が試したこと:

括弧付きの分割を使用するのは近いようですが、必要なように検索パターンが結果に添付されたままになりません。

re.split('CDE()FG', 'ABCDEFGHIJKLMNOCDEFGZYPE')

与える、

['AB', 'HIJKLMNO', 'ZYPE']

実際に必要なときは、

['ABCDE', 'FGHIJKLMNOCDE', 'FGZYPE']

動機:

RegEx の練習をしていて、RegEx を使用して、特定のプロテアーゼを使用したタンパク質消化のフラグメントを予測するスクリプトを作成できるかどうかを確認したいと考えていました。

0 投票する
1 に答える
40 参照

math - 可能な限り最長の文字列の長さには、繰り返される 3-mer が含まれていません

3-mer の繰り返しを含まない連続した数字の可能な限り最長の文字列の長さを見つけようとしています。

これはバイオインフォマティクスの問題で、これをタンパク質配列で分類しています。

基本的に、みたいなことは繰り返す0102340109のでうまくいきません。010

ただし、00022235897653桁の繰り返しが見つからないため、次のようなものが機能します。

最長のシーケンスを見つける必要がありますが、行き詰まっていて無知です。

0 投票する
1 に答える
263 参照

dictionary - pdb ファイルからのディクショナリ キー

私は.pdbファイルを調べて、タンパク質複合体の鎖AとBの異なる残基からアルファ炭素原子間の距離を計算し、その距離を鎖識別子と残基番号とともに辞書に保存しようとしています.

たとえば、最初のアルファ炭素 (「CA」) がチェーン A の残基 100 にあり、それが結合するものがチェーン BI の残基 123 にある場合、私の辞書は d={(A, 100) のようになります。 :[B, 123, 原子間距離]}

何年もの間プログラムを実行していたので、実行を中止しなければなりませんでした (どこかで無限ループを作ったのでしょうか??)

私もこれをやろうとしていました:

ただし、次の形式で残留物に関する情報を出力しています。

距離に関連するものは何も出力していません。

どうもありがとう、私はすべてが明確であることを願っています。

0 投票する
2 に答える
231 参照

python - アミノ酸結合部位検索、タンパク質データベース

2 つの異なる鎖に属する 2 つの原子が「結合」していると見なされるかどうかを調べようとしています。これは、距離 (指定された x、y、z 座標で求められるユークリッド) が 2 つの原子のファン デル ワールスに 0.5A を加えた値よりも短い場合、拘束されていると見なされるという事実に基づいています。問題は、各原子のファン デル ワールスを計算する方法を理解していなかったことです。PDBでは、原子名はCB1、CAなどのようであり、単一の原子ではないためです。たとえば、N のワールス半径は知っています。原子間の原子間距離を計算するコードを書くことはできますが、重要なファン デル ワールスの部分を実行できませんでした。2 つのチェーンと PDB へのリンクから情報を抽出するために作成したコードを次に示します。

http://www.rcsb.org/pdb/explore.do?structureId=3KUD

互いに相互作用する可能性のある 2 つの原子間のファン デル ワールス半径を計算する方法がわかれば、これら 2 つのチェーンの間に for ループを作成して距離を比較できます。

編集:CB、OG1がそれぞれ炭素と酸素であり、ファンデルワールス値を取るように、各原子が最初の文字であると仮定して先に進むことにしました. それにもかかわらず、2 つのチェーン間の for ループを作成し、if 'vanderWaalsOfatomOfChainA + vanderWaalsOfatomOfChainB + 0.5' > 'Their distance based on theeuclidian formula': などの形式で距離を計算するコードを書くのにまだ苦労しています。

編集: Chain_A と Chain_B の各リストにファン デル ワールス半径を追加できました。コードは次のとおりです。

しかし、必要なのは、両方のチェーンに対して for ループを作成する方法を見つけることだけです。つまり、A と B のすべての原子を比較する必要があります。12. 各リストのスロットはファン デル ワールス半径を示し、A の各リストの 12 番目と B の各リストの 12 番目に 0.5 を加えた値を計算して比較する必要があります。ユークリッドの公式!

最終編集: このコードを書きましたが、機能しません! この考えに基づいて、Chain_A の各要素を Chain_B と比較する必要があります。

0 投票する
0 に答える
333 参照

c - C を使用して PDB ファイルから特定の原子座標を読み取る方法

さらに処理するために、THR、PHE、TYR、TRP、およびそれらの原子の座標を含むレコードを取得しようとしました。しかし、すべてを台無しにする pdb ファイルには、目に見えない ASCII 文字がたくさんあるようです。これを取り除く方法は?