私は次の問題を抱えています:
HTMLファイルを解析してHTMLファイルからリンクを取得したいと思います。次のコードでリンクを取得できます。
class MyHTMLParser(HTMLParser):
links=[]
def __init__(self,url):
HTMLParser.__init__(self)
self.url = url
def handle_starttag(self, tag, attrs):
try:
if tag == 'a':
for name, value in attrs:
if name == 'href':
if value[:5]=="http:":
self.links.append(value)
except:
pass
しかし、オーディオファイルやビデオファイルなどは取得したくありません。HTMLリンクのみを取得したいのです。どうやってやるの?