序数で区切られた長い文字列があります。例:「1。おはよう2.こんにちは3.さようなら」(ただし、最初に番号があることは必須ではなく、番号がいくつあるかわかりません)。このようなリスト:["Good morning", "Hello", "Bye"]
1 に答える
4
In [1]: s = '1. Good morning 2. Hello 3. Bye'
In [2]: import re
In [3]: re.split('\d+\. ', s)
Out[3]: ['', 'Good morning ', 'Hello ', 'Bye']
最初に数字がない場合、最初の要素は空になりません。ただし、これは番号が正しい順序になっていることを確認しません。これが重要かどうか教えてください。
編集:コメントをくれた@glglglに感謝します。先頭/末尾のスペースに関しては、分割する' *\d+\. *'
方がよい場合があります。
于 2012-06-22T11:34:14.713 に答える