このようなリストを取得します(数字はコメントの数です)...
14 http://www.spiegelfechter.com/wordpress/8726/auswege-aus-der-sackgasse
26 http://www.spiegelfechter.com/wordpress/8722/die-asozialen-hinter-die-asozialen
77 http://www.spiegelfechter.com/wordpress/8717/in-gesetz-gegossene-verfassungswidrigkeit
91 http://www.spiegelfechter.com/wordpress/8714/the-same-procedure-as-every-year-europa-lugt-sich-selbst-in-die-tasche
279 http://www.spiegelfechter.com/wordpress/8709/konstruktionsfehler-des-grundeinkommens
...経由...
import urllib2
import re
def main():
pattern = re.compile('<a href="(.*)#comments".*>(\d+) Kommentare</a>')
liste = []
for k in range(2, 3):
for line in urllib2.urlopen("http://www.spiegelfechter.com/wordpress/page/" + str(k)):
matcher = pattern.search(line)
if matcher != None:
liste.append("%4s" % matcher.group(2) + " " + matcher.group(1))
for elt in sorted(liste):
print elt
if __name__ == '__main__':
main()
私は77を持っていますが、Pythonで4を取得するにはどうすればよいですか...? 4はjavascriptで生成されていると思いますし、Pythonでjavascriptを扱うのは難しいと思いますが、この場合は簡単かもしれません?!