現在、PDB のデータセットを扱っており、残基のサイズ (残基あたりの原子数) に興味があります。原子の数 -len(residue.child_list) - は、同じ残基であっても、異なるタンパク質の残基とは異なることに気付きました。例: 残基 'LEU' は、あるタンパク質では 8 個の原子を持ち、別のタンパク質では 19 個の原子を持ちます!
私の推測では、PDB または PDBParser() のエラーですが、違いは非常に大きいです。
たとえば、分子 3OQ2 の場合:
r = model['B'][88]
r1 = model['B'][15] # residue at chain B position 15
In [287]: r.resname
Out[287]: 'VAL'
In [288]: r1.resname
Out[288]: 'VAL'
しかし
In [274]: len(r.child_list)
Out[274]: 16
In [276]: len(r1.child_list)
Out[276]: 7
分子の中でも原子の数に違いがあります。これが生物学的に正常なのか、それとも何か問題があるのか知りたいです。ありがとうございました。
強いテキスト