0

私のアイデアは、Groupon の Web サイトを調べて、取引の URL を抽出することでした。問題は、Groupon のページで findall を実行して次のようなデータを見つけようとしていることです: (このページの: http://www.groupon.de/alle-deals/muenchen/restaurant-296 )

"category":"RESTAURANT1","dealPermaLink":"/deals/muenchen-special/Casa-Lavecchia/24788330", and I'd like to get the 'deals/muenchen-special/Casa-Lavecchia/24788330'.

一晩中試しましたが、正しい正規表現が見つかりません。私は試した:

import urllib2
import re
Page_Web = urllib2.urlopen('http://www.groupon.de/alle-deals/muenchen/restaurant-296').read()
for m in re.findall('category*RESATAURANT1*dealPermaLink*:?/*/*/*/*\d$',Page_Web):
   print m

しかし、それは何も印刷しません。

4

2 に答える 2

-1

まずは に変えRESATAURANT1てみてRESTAURANT1はいかがでしょうか?

于 2013-07-30T09:30:14.877 に答える