リストからいくつかのファイルにアイテムを書き込もうとしています。各ファイルに日付に従って名前を付けたいと思います。HTMLをスクレイプするために正規表現を使用するべきではないことを私は知っていることを覚えておいてください、しかし当分の間それは私にうまく役立ちます。無知を失礼しますが、私は初心者です。このスクレイピングは学術目的のみです。前もって感謝します。
from urllib import urlopen
import re
webpage = urlopen('x').read()
date = re.compile('[0-9]{2}-[a-zA-Z]{3}-[0-9]{4}')
article = re.compile('<span>.*<div>', re.DOTALL)
findDate = re.findall(patFinderDate,webpage)
findArticle = re.findall(patFinderArticle,webpage)
listIterator = []
listIterator[:] = range(0,1000)
for i in listIterator:
filename = findDate[i]
with open(filename,"w") as f:
f.write(i)
f.close()