Python で RE 式を使用して、テキストのチャンクをピリオドと感嘆符で分割しようとしています。ただし、分割すると、結果に「なし」が表示されます
a = "This is my text...I want it to split by periods. I also want it to split \
by exclamation marks! Is that so much to ask?"
これは私のコードです:
re.split('((?<=\w)\.(?!\..))|(!)',a)
楕円を避けたいので、これ (?<=\w).(?!..) があることに注意してください。それにもかかわらず、上記のコードは吐き出します:
['This is my text...I want it to split by periods', '.', None, ' \
I also want it to split by exclamation marks', None, '!', \
' Is that so much to ask?']
ご覧のとおり、ピリオドまたは感嘆符がある場所では、特別な「なし」がリストに追加されています。これはなぜですか、どうすればそれを取り除くことができますか?