約 200,000 行の pdb テキスト ファイルがあります。すべての行は次のようになります。
COMPND
SOURCE
HETATM 1 CT 100 1 -23.207 17.632 14.543
HETATM 2 CT 99 1 -22.069 18.353 15.280
HETATM 3 OH 101 1 -21.074 18.762 14.358
HETATM 4 F 103 1 -23.816 18.483 13.675
HETATM 5 F 103 1 -24.119 17.162 15.433
HETATM 6 F 103 1 -22.680 16.591 13.841
HETATM 7 HC 104 1 -21.623 17.681 16.014
HETATM 8 HC 104 1 -22.451 19.218 15.823
HETATM 9 HO 102 1 -21.040 18.108 13.673
HETATM 10 CT 100 2 -4.340 -29.478 45.144
HETATM 11 CT 99 2 -3.051 -29.846 44.395
HETATM 12 OH 101 2 -1.968 -29.072 44.880
HETATM 13 F 103 2 -4.217 -29.778 46.464
HETATM 14 F 103 2 -5.396 -30.156 44.621
HETATM 15 F 103 2 -4.551 -28.140 45.015
HETATM 16 HC 104 2 -3.178 -29.656 43.329
HETATM 17 HC 104 2 -2.829 -30.908 44.511
HETATM 18 HO 102 2 -2.315 -28.222 45.119
HETATM 19 CT 100 3 -49.455 -17.542 -31.718
HETATM 20 CT 99 3 -49.981 -18.984 -31.736
HETATM 21 OH 101 3 -48.905 -19.897 -31.607
HETATM 22 F 103 3 -48.867 -17.273 -30.521
HETATM 23 F 103 3 -50.474 -16.668 -31.929
HETATM 24 F 103 3 -48.527 -17.405 -32.704
...
C1 の最初の CT と C2 の 2 番目の CT をすべて変更する必要があり、F1、F2、F3、および HC の同じものを H1、H2 に変更する必要があります。
小さなスクリプトで awk と sed を使用してそれらを変更することは可能ですか? 各 C1-C2 および F1、F2、F3 は同じ分子 (トリフルオロエタノール - TFE) の一部ですが、定義される TFE の分子は多数あります。
だから私はそれがこのように見えるようにしたい:
COMPND
SOURCE
HETATM 1 C1 100 1 -23.207 17.632 14.543
HETATM 2 C2 99 1 -22.069 18.353 15.280
HETATM 3 OH 101 1 -21.074 18.762 14.358
HETATM 4 F1 103 1 -23.816 18.483 13.675
HETATM 5 F2 103 1 -24.119 17.162 15.433
HETATM 6 F3 103 1 -22.680 16.591 13.841
HETATM 7 H1 104 1 -21.623 17.681 16.014
HETATM 8 H2 104 1 -22.451 19.218 15.823
HETATM 9 HO 102 1 -21.040 18.108 13.673
HETATM 10 C1 100 2 -4.340 -29.478 45.144
HETATM 11 C2 99 2 -3.051 -29.846 44.395
HETATM 12 OH 101 2 -1.968 -29.072 44.880
HETATM 13 F1 103 2 -4.217 -29.778 46.464
HETATM 14 F2 103 2 -5.396 -30.156 44.621
HETATM 15 F3 103 2 -4.551 -28.140 45.015
HETATM 16 H1 104 2 -3.178 -29.656 43.329
HETATM 17 H2 104 2 -2.829 -30.908 44.511
HETATM 18 HO 102 2 -2.315 -28.222 45.119
HETATM 19 C1 100 3 -49.455 -17.542 -31.718
HETATM 20 C2 99 3 -49.981 -18.984 -31.736
HETATM 21 OH 101 3 -48.905 -19.897 -31.607
HETATM 22 F1 103 3 -48.867 -17.273 -30.521
HETATM 23 F2 103 3 -50.474 -16.668 -31.929
HETATM 24 F3 103 3 -48.527 -17.405 -32.704
...
ありがとう