私は .smiles ファイルに取り組んでいます。.smiles ファイルのファイル構造は次のとおりです。http://en.wikipedia.org/wiki/Chemical_file_format#SMILES
smiles ファイルからすべてのアトムを取得したいと考えています。つまり、単一の「C」原子がある場合、4 つの「H」原子がそれらに接続されることを意味します。
私は検索中に、笑顔の形式を解析できるPythonのモジュールがいくつかあることを発見しましたが、それらはサポートされている水素原子を与えません。(例: 'C' 原子のみを与え、その 'C' 原子に接続された他の 4 つの 'H' 原子は与えません)
Pythonを使用して、接続された「H」原子も含むすべての原子を見つけるにはどうすればよいですか。
接続された 'H' 原子を含むすべての原子に変換する必要がある笑顔ファイルの例:
[H]OC([H])([H])[C@@]1([H])C([H])=C([H])[C@@]([H])(n2c([H])nc3c(nc(nc23)N([H])[H])N([H])C2([H])C([H])([H])C2([H])[H])C1([H])[H]
前もって感謝します。