0

私はこのコードを持っています:

import urllib
from bs4 import BeautifulSoup

url = "http://www.padtube.com/Audio-Files-Player/30-01-1-2.html"
pageurl = urllib.urlopen(url)
soup = BeautifulSoup(pageurl)

for b in soup.select("table#dl-tbl-list th a[href]"):
    print b['href']

このコードを実行すると、最初のページにのみリンクが表示されます。次のページのアプリケーション リンクを取得できません。

4

1 に答える 1

1

サイトはpost次のページに移動するために使用しているため、必要なのはページ番号を郵送で送信することです。

私はhttp://www.python-requests.org/経由でこれを行いました

import urllib
from bs4 import BeautifulSoup

import requests

url = "http://www.padtube.com/Audio-Files-Player/30-01-1-2.html"
#pageurl = urllib.urlopen(url)

pageurl = requests.post(url, data = {
    'page': 2
})


pageurl = pageurl.text

soup = BeautifulSoup(pageurl)

for b in soup.select("table#dl-tbl-list th a[href]"):
    print b['href']
于 2013-11-07T08:13:03.717 に答える