私のウェブスクレイパーのどこが間違っているのか教えていただければ幸いです。
私がやりたいことは、特定の文字列 ("Sorry, Gruen Fan") がページで変更されたときに通知を受けることです。文字列を取り込むことはできますが、「If」関数が機能していないようです。その出力は「Text is in」になるはずです。コードは次のとおりです。
from bs4 import BeautifulSoup
from urllib import urlopen
import re
urls= ["http://www.abc.net.au/tv/programs/gruen-nation/"]
for url in urls:
webpage = urlopen(url).read()
FindTitle = re.compile('\t\t\t\t(.*)\.<BR><BR>')
FindTitle = re.findall(FindTitle,webpage)
print FindTitle[0]
print ' '
if 'Sorry, Gruen fan' in FindTitle:
print("Text is in")
else:
print("Text isn't in")
お時間をいただきありがとうございます。
サム。