python - テキスト全体に散在する文字パターンの正規表現

Question

私は Python と正規表現初心者です。次のステートメントによって、html ソースの全ページをコマンドラインに取り込むことができました。

print (driver.page_source).encode('utf-8')

涼しい。しかし、そのテキストには、抽出して配列に格納する必要がある予測可能な文字列がいくつかあります。探している文字列パターンは、[4 つの数字] の後に [ハイフン] が続き、その後に 1 ～ 5 個の数字が続きます。例:

2013-80324 または 2013-03 ですが、2013-832888 ではありません

助けてくれてありがとう。

score 2 · Accepted Answer

(?:^|(?<=\D))\d{4}-\d{1,5}(?=\D|$)

1 に答える 1