問題タブ [protein-database]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
67 参照

bioinformatics - BioPython: 残基のサイズが位置と異なる

現在、PDB のデータセットを扱っており、残基のサイズ (残基あたりの原子数) に興味があります。原子の数 -len(residue.child_list) - は、同じ残基であっても、異なるタンパク質の残基とは異なることに気付きました。例: 残基 'LEU' は、あるタンパク質では 8 個の原子を持ち、別のタンパク質では 19 個の原子を持ちます!

私の推測では、PDB または PDBParser() のエラーですが、違いは非常に大きいです。

たとえば、分子 3OQ2 の場合:

しかし

分子の中でも原子の数に違いがあります。これが生物学的に正常なのか、それとも何か問題があるのか​​知りたいです。ありがとうございました。

強いテキスト

0 投票する
2 に答える
343 参照

linux - pdbファイルの2〜3〜4行ごとにawkとsedを使用してテキストを置き換えます

約 200,000 行の pdb テキスト ファイルがあります。すべての行は次のようになります。

C1 の最初の CT と C2 の 2 番目の CT をすべて変更する必要があり、F1、F2、F3、および HC の同じものを H1、H2 に変更する必要があります。

小さなスクリプトで awk と sed を使用してそれらを変更することは可能ですか? 各 C1-C2 および F1、F2、F3 は同じ分子 (トリフルオロエタノール - TFE) の一部ですが、定義される TFE の分子は多数あります。

だから私はそれがこのように見えるようにしたい:

ありがとう

0 投票する
1 に答える
432 参照

bioinformatics - BLAST: blastpgp が出力ファイルを生成しない、データベース フラグを正しく使用しているかどうか不明

質問1:

私は以下を実行しています:

ここで、 protein.fasta は単一のタンパク質配列を含む fasta ファイルです。これは出力を生成せず、-o ファイルは空です。

質問2:

私は正常に使用できました:

データベースファイルを作成します。ただし、これにより複数のファイル、.phr、.pin、.psd、.psi、.psq が作成されました。自分のデータベースを使用するには、これらのどれを -d フラグで渡す必要がありますか?

ありがとうございました!

0 投票する
2 に答える
8915 参照

regex - 行の順序を変更せずに grep を使用して、2 つの文字列のいずれかを検索しますか?

これは尋ねられたと確信していますが、見つからないため、重複して申し訳ありません。

grep または egrep を使用して、「 P 」または「 CA 」が含まれるすべての行を見つけて、それらを新しいファイルにパイプしたいと考えています。次を使用して、どちらか一方を使用して簡単に実行できます。

また

正規表現は初めてなので、の構文がわかりませんor

更新: 出力行の順序は重要です。つまり、出力が一致した文字列で行をソートしたくありません。以下は、1 つのファイルの最初の 8 行の例です。

この例の結果ファイルは次のようになります。

0 投票する
1 に答える
165 参照

biopython - biopython のクラス DSSP は、アミノ酸の相対的な溶媒アクセシビリティ値を示しますか?

現在、biopythonのDSSPモジュールを使用して、タンパク質中のアミノ酸の相対的な溶媒アクセシビリティを持ちたいと考えています。出力に rsa (相対溶媒アクセシビリティ) があるかどうか、または計算する必要があるかどうかわかりません。どんな助けでも大歓迎です。ありがとう。 

0 投票する
1 に答える
474 参照

r - 単一の PDB ファイルから複数のタンパク質鎖を抽出する

複数のチェーンを含む PDB ファイルがありますが、チェーン ID はありません。R を使用して chainid を割り当て、個々のタンパク質鎖を分析し、それぞれの特定の部位を見つけられるようにしたいと考えています。

現在、Rpdb を使用してファイルを抽出しています。サンプル データ (単一の pdb ファイルからの各チェーンの上位数行) を以下に示します。

列名は Rpdb によって次のように追加されます (注: chainid、insert、および segid には値がありません)。

上記のchainidに追加する方法を知っている人はいますか? ありがとう!

0 投票する
1 に答える
1620 参照

python - pdb にチェーン ID を追加する方法

biopython ライブラリを使用して、pdb ファイルにチェーン ID を追加したいと考えています。私は使用しています

しかし、私はこのエラーが発生しました:

child.dict のキーを変更しようとしましたが、別のエラーが発生しました:

チェーン ID を追加するにはどうすればよいですか?