テレビ キャッチアップ Web サイトから html をフェッチし、分割関数を使用して、すべての html データをチャンネル名とテーブルで現在オンになっているプログラムだけに分割するプログラムを作成しようとしています。 1 - 「プログラム名」。誰かがそれを助けることができれば、最初の分割機能の後に私が何をするかについて助けが必要です。
import urllib2
import string
proxy = urllib2.ProxyHandler({"http" : "http://c99.cache.e2bn.org:8084"})
opener = urllib2.build_opener(proxy)
urllib2.install_opener(opener)
tvCatchup = urllib2.urlopen('http://www.TVcatchup.com')
html = tvCatchup.read()
firstSplit = html.split('<a class="enabled" href="/watch.html?c=')[1:]
for i in firstSplit:
print i
secondSplit = html.split ('1" title="BBC One"></a></li><li class="v-type" style="color:#6d6d6d;">')[1:]
for i in secondSplit:
print i