0

現在、PDB のデータセットを扱っており、残基のサイズ (残基あたりの原子数) に興味があります。原子の数 -len(residue.child_list) - は、同じ残基であっても、異なるタンパク質の残基とは異なることに気付きました。例: 残基 'LEU' は、あるタンパク質では 8 個の原子を持ち、別のタンパク質では 19 個の原子を持ちます!

私の推測では、PDB または PDBParser() のエラーですが、違いは非常に大きいです。

たとえば、分子 3OQ2 の場合:

r = model['B'][88]
r1 = model['B'][15] # residue at chain B position 15

In [287]: r.resname
Out[287]: 'VAL'
In [288]: r1.resname
Out[288]: 'VAL'

しかし

In [274]: len(r.child_list)
Out[274]: 16
In [276]: len(r1.child_list)
Out[276]: 7

分子の中でも原子の数に違いがあります。これが生物学的に正常なのか、それとも何か問題があるのか​​知りたいです。ありがとうございました。

強いテキスト

4

1 に答える 1

1

提供された PDB を見たところ、実際の違いは、最初の VAL (88) には水素 (H) の原子座標があるのに対し、他の VAL (15) には存在しないという事実です。

ATOM   2962  N   VAL B  88      33.193  42.159  23.916  1.00 11.01           N  
ANISOU 2962  N   VAL B  88     1516    955   1712     56   -227   -128       N  
ATOM   2963  CA  VAL B  88      33.755  43.168  24.800  1.00 12.28           C  
ANISOU 2963  CA  VAL B  88     1782   1585   1298    356    -14    286       C  
ATOM   2964  C   VAL B  88      35.255  43.284  24.530  1.00 12.91           C  
ANISOU 2964  C   VAL B  88     1661   1672   1573   -249      0   -435       C  
ATOM   2965  O   VAL B  88      35.961  42.283  24.451  1.00 14.78           O  
ANISOU 2965  O   VAL B  88     1897   1264   2453     30   -293     21       O  
ATOM   2966  CB  VAL B  88      33.524  42.841  26.286  1.00 12.81           C  
ANISOU 2966  CB  VAL B  88     1768   1352   1747    -50   -221   -304       C  
ATOM   2967  CG1 VAL B  88      34.166  43.892  27.160  1.00 16.03           C  
ANISOU 2967  CG1 VAL B  88     2292   1980   1819   -147     73     -8       C  
ATOM   2968  CG2 VAL B  88      32.020  42.727  26.586  1.00 17.67           C  
ANISOU 2968  CG2 VAL B  88     2210   2728   1774   -363   -401     83       C  
ATOM   2969  H   VAL B  88      33.642  41.425  23.899  1.00 13.21           H  
ATOM   2970  HA  VAL B  88      33.340  44.035  24.608  1.00 14.73           H  
ATOM   2971  HB  VAL B  88      33.941  41.979  26.492  1.00 15.37           H  
ATOM   2972 HG11 VAL B  88      34.011  43.670  28.081  1.00 19.23           H  
ATOM   2973 HG12 VAL B  88      35.110  43.912  26.983  1.00 19.23           H  
ATOM   2974 HG13 VAL B  88      33.777  44.746  26.959  1.00 19.23           H  
ATOM   2975 HG21 VAL B  88      31.902  42.523  27.516  1.00 21.20           H  
ATOM   2976 HG22 VAL B  88      31.596  43.562  26.377  1.00 21.20           H  
ATOM   2977 HG23 VAL B  88      31.647  42.026  26.047  1.00 21.20           H

分析のすべての残基について、これらの原子を除外します。そうすれば、ほぼ常に同じ数の原子が得られるはずです。誰かが言及したように、考慮しなければならないもう1つのことは、Biopythonが「無秩序な残基」と呼んでいるものです。これらは、結晶格子内の原子の代替位置が複数ある残基です (これを「altloc」と呼びます)。これを整理すると、問題が解決するはずです。これらの原子を除外するのに助けが必要な場合はお知らせください。ファビオ

于 2015-04-02T10:00:07.597 に答える