ディレクトリにあるPDB(テキスト)ファイルがあります。各 PDB ファイルからサブユニットの数を出力したいと思います。
- で始まる pdb ファイル内のすべての行を読み取ります。
ATOM
- 行の 5 列目には、、、などが含まれ
ATOM
ます。A
B
C
D
A
サブユニットの数だけが含まれている場合は 1 です。とが含まA
れてB
いる場合は、サブユニットA
の数は 2 です。B
C
1kg2.pdb ファイル
ATOM 1363 N ASN A 258 82.149 -23.468 9.733 1.00 57.80 N
ATOM 1364 CA ASN A 258 82.494 -22.084 9.356 1.00 62.98 C
ATOM 1395 C MET B 196 34.816 -51.911 11.750 1.00 49.79 C
ATOM 1396 O MET B 196 35.611 -52.439 10.963 1.00 47.65 O
1uz3.pdb ファイル
ATOM 1384 O ARG A 260 80.505 -20.450 15.420 1.00 22.10 O
ATOM 1385 CB ARG A 260 78.980 -18.077 15.207 1.00 36.88 C
ATOM 1399 SD MET B 196 34.003 -52.544 16.664 1.00 57.16 S
ATOM 1401 N ASP C 197 34.781 -50.611 12.007 1.00 44.30 N
2b69.pdb ファイル
ATOM 1393 N MET B 196 33.300 -54.017 12.033 1.00 46.46 N
ATOM 1394 CA MET B 196 33.782 -52.714 12.566 1.00 49.99 C
希望の出力
pdb_id subunits
1kg2 2
1uz3 3
2b69 1
awk、python、またはBiopythonでこれを行うにはどうすればよいですか?