テキストを文章に分割したい。誰か助けてもらえますか?
略語も処理する必要があります。しかし、私の計画はこれらを早い段階で交換することです。氏->ミスター
import re
import unittest
class Sentences:
def __init__(self,text):
self.sentences = tuple(re.split("[.!?]\s", text))
class TestSentences(unittest.TestCase):
def testFullStop(self):
self.assertEquals(Sentences("X. X.").sentences, ("X.","X."))
def testQuestion(self):
self.assertEquals(Sentences("X? X?").sentences, ("X?","X?"))
def testExclaimation(self):
self.assertEquals(Sentences("X! X!").sentences, ("X!","X!"))
def testMixed(self):
self.assertEquals(Sentences("X! X? X! X.").sentences, ("X!", "X?", "X!", "X."))
ありがとう、バリー
編集:最初に、私は上記に含めた4つのテストを満足させたいと思います。これは、正規表現がどのように機能するかをよりよく理解するのに役立ちます。今のところ、テストで定義されているように、文をXなどとして定義できます。