FINDALL を使用してすべての特定の Web ページを取得し、それらを配列に渡す必要がありますが、引用符のないリンクだけです。配列ではない場合、使用できるループ内の個々のリンクに変数を渡すことができます。それらを1つずつ、または一度にすべて
#!/usr/bin/env python
import re,urllib,urllib2
Url = "http://www.ihiphopmusic.com/music"
print Url
print 'test .............'
req = urllib2.Request(Url)
print "1"
response = urllib2.urlopen(req)
print "2"
#reads the webpage
the_webpage = response.read()
#grabs the title
the_list = re.findall(r'number-link" href="(.*?)#comments">0</a>',the_webpage)
print "3"
the_list = the_list.split(',')
arrlist = array('c',the_list)
print arrlist
結果
http://www.ihiphopmusic.com/music
test .............
1
2
3
Traceback (most recent call last):
File "grub.py", line 17, in <module>
the_list = the_list.split(',')
AttributeError: 'list' object has no attribute 'split'