文字列にたくさんの名前があり、それぞれの名と姓は「>」と「>」の中にあります。したがって、文字列はたとえば次のようになり'uselessdataetc<Michael Bloomberg>blahblah<William Handler>blahblah'
ます'Michael Bloomberg'
。'William Handler'
これは私が使用している正規表現です:
nameregex = '<([a-z]+|\s)*>'
正規表現を使用するときに re.IGNORECASE を使用しています。現在、姓のみを返しています。したがって、「Bloomberg」、「Handler」が返されます。
なぜこれが起こっているのか誰にもわかりますか?