0

この Web ページのすべてのリンクを解析するのに苦労しています : https://recordings.engineering.illinois.edu:8443/ess/portal/section/8a3458dc-ed31-4c93-8e3e-3b64b1f89fe8リンクのうち、各レクチャーをダウンロードするために表示されるビデオ ファイルのリンクのみを保持します。

bs4 から httplib2 をインポートする BeautifulSoup、SoupStrainer をインポートする

http = httplib2.Http()
status, response =      http.request('https://recordings.engineering.illinois.edu:8443/ess/portal/section/8a3458dc-ed31-4c93-8e3e-3b64b1f89fe8')

for link in BeautifulSoup(response, "html.parser",parse_only      =SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

上記は、リンクを解析する必要がある私のコードです。

次に、 の行に沿って何かを使用して、webbrowser.open_new_tab(url)各リンクで新しいタブを開きます (各ビデオのダウンロードを開始するために必要なのはこれだけです)。

Beautifulsoup は、この特定の URL へのリンクを取得するのに苦労しているようです。他のより単純なページでうまく機能します。問題が何であるかについてのアイデアはありますか?

4

0 に答える 0