以下の文字列のセットがあります:
*H. NGUYEN1、J. SATZ2,3,4,5、R. TURK2,3,4,5、K. CAMPBELL2,3,4,5、S. MOORE1
1 病理学、2Mol. 生理。and Biophysics, 3Neurol., 4Intrnl. 医学部 アイオワ州アイオワシティ、アイオワ州。5 ハワード・ヒューズ医学. 研究所、アイオワシティ、アイオワ州
予想される出力は次のとおりです。
1) *H. NGUYEN1、J. SATZ2,3,4,5、R. TURK2,3,4,5、K. CAMPBELL2,3,4,5、S. MOORE1
2) 1病理学、2Mol. 生理。and Biophysics, 3Neurol., 4Intrnl. 医学部 アイオワ州アイオワシティ、アイオワ州。5 ハワード・ヒューズ医学. 研究所、アイオワシティ、アイオワ州
上記の文字列は、著者名と住所の組み合わせです。
文字列の名前の末尾に (;) が含まれることがあります。たとえば、S.MOORE1; S. MOORE1
以下の正規表現を試しましたが、期待どおりの結果が得られませんでした。私は正規表現の学習者なので、助けてください。
;?[\d*]\w+
パターンは:
単語の後に数字が続き、セミコロンが続くか、スペースの後に数字が続き、単語が続きます。例: S.MOORE1(; または Space)1Pathology.S.MOORE1 と 1Pathology として行を分割する必要があります
ありがとう