python - BeautifulSoupを使用してWebページのリンクを解析するのに苦労しました

翻译自：https://stackoverflow.com/questions/36949674 2016-04-30T01:14:20.803

69 次

この Web ページのすべてのリンクを解析するのに苦労しています : https://recordings.engineering.illinois.edu:8443/ess/portal/section/8a3458dc-ed31-4c93-8e3e-3b64b1f89fe8リンクのうち、各レクチャーをダウンロードするために表示されるビデオファイルのリンクのみを保持します。

bs4 から httplib2 をインポートする BeautifulSoup、SoupStrainer をインポートする

http = httplib2.Http()
status, response =      http.request('https://recordings.engineering.illinois.edu:8443/ess/portal/section/8a3458dc-ed31-4c93-8e3e-3b64b1f89fe8')

for link in BeautifulSoup(response, "html.parser",parse_only      =SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

上記は、リンクを解析する必要がある私のコードです。

次に、の行に沿って何かを使用して、webbrowser.open_new_tab(url)各リンクで新しいタブを開きます (各ビデオのダウンロードを開始するために必要なのはこれだけです)。

Beautifulsoup は、この特定の URL へのリンクを取得するのに苦労しているようです。他のより単純なページでうまく機能します。問題が何であるかについてのアイデアはありますか？

python - BeautifulSoupを使用してWebページのリンクを解析するのに苦労しました

0 に答える 0

Related

Reference