私のアイデアは、Groupon の Web サイトを調べて、取引の URL を抽出することでした。問題は、Groupon のページで findall を実行して次のようなデータを見つけようとしていることです: (このページの: http://www.groupon.de/alle-deals/muenchen/restaurant-296 )
"category":"RESTAURANT1","dealPermaLink":"/deals/muenchen-special/Casa-Lavecchia/24788330", and I'd like to get the 'deals/muenchen-special/Casa-Lavecchia/24788330'.
一晩中試しましたが、正しい正規表現が見つかりません。私は試した:
import urllib2
import re
Page_Web = urllib2.urlopen('http://www.groupon.de/alle-deals/muenchen/restaurant-296').read()
for m in re.findall('category*RESATAURANT1*dealPermaLink*:?/*/*/*/*\d$',Page_Web):
print m
しかし、それは何も印刷しません。