次の構造の文字列を含むテキストがあります。
text I do not care about, persons name followed by two IDs.
そんなこと知ってる:
- 人の名前の前には常に
XYZ
コードが付き、その後にはスペースで区切られた 2 つの数字が続きます。 Name
姓と名だけではありません。複数の姓または名を使用できます (ラテン アメリカの名前を考えてください)。
そのため、定数コードに続き、常にXYZ
2つの別々の数字で終わる文字列を抽出しようとしています。
私の区切り文字は と 2 つの数字であると言えますがXYZ
、数字も抽出される値の一部である必要があります。
から
何とか、何とか XYZ 名前、名前 122322 344322 何とか何とか
抽出したい:
名前、名前 122322 344322
Python の re パッケージで動作する正規表現について誰かアドバイスをください。