N
オフセットを指定して、単語数を表示する正規表現マスクを作成しようとする文字列があります。次の文字列があるとします。
"The quick, brown fox jumps over the lazy dog."
私は一度に3つの単語を表示したい:
オフセット0
:"The quick, brown"
オフセット1
:"quick, brown fox"
オフセット2
:"brown fox jumps"
オフセット3
:"fox jumps over"
オフセット4
:"jumps over the"
オフセット5
:"over the lazy"
オフセット6
:"the lazy dog."
私はPythonを使用しており、次の単純な正規表現を使用して3つの単語を検出しています:
>>> import re
>>> s = "The quick, brown fox jumps over the lazy dog."
>>> re.search(r'(\w+\W*){3}', s).group()
'The quick, brown '
しかし、最初の単語ではなく、次の 3 つの単語を表示する一種のマスクを作成する方法がわかりません。句読点を守らなければなりません。