ウェブページを解析し、そのページ上のリンク ('a' タグ) の量を取得するスクリプトを作成しました。
import urllib
import lxml.html
connection = urllib.urlopen('http://test.com')
dom = lxml.html.fromstring(connection.read())
for link in dom.xpath('//a/@href'):
print link
スクリプトの出力:
./01.html
./52.html
./801.html
http://www.blablabla.com/1.html
#top
リンクの数をカウントするためにリストに変換するにはどうすればよいですか? 私は link.split() を使用していますが、それは私に届きました:
['./01.html']
['./52.html']
['./801.html']
['http://www.blablabla.com/1.html']
['#top']
しかし、私は取得したい:
[./01.html, ./52.html, ./801.html, http://www.blablabla.com/1.html, #top]
ありがとう!