私は Python と正規表現初心者です。次のステートメントによって、html ソースの全ページをコマンド ラインに取り込むことができました。
print (driver.page_source).encode('utf-8')
涼しい。しかし、そのテキストには、抽出して配列に格納する必要がある予測可能な文字列がいくつかあります。探している文字列パターンは、[4 つの数字] の後に [ハイフン] が続き、その後に 1 ~ 5 個の数字が続きます。例:
2013-80324 または 2013-03 ですが、2013-832888 ではありません
助けてくれてありがとう。