この Web ページのすべてのリンクを解析するのに苦労しています : https://recordings.engineering.illinois.edu:8443/ess/portal/section/8a3458dc-ed31-4c93-8e3e-3b64b1f89fe8リンクのうち、各レクチャーをダウンロードするために表示されるビデオ ファイルのリンクのみを保持します。
bs4 から httplib2 をインポートする BeautifulSoup、SoupStrainer をインポートする
http = httplib2.Http()
status, response = http.request('https://recordings.engineering.illinois.edu:8443/ess/portal/section/8a3458dc-ed31-4c93-8e3e-3b64b1f89fe8')
for link in BeautifulSoup(response, "html.parser",parse_only =SoupStrainer('a')):
if link.has_attr('href'):
print link['href']
上記は、リンクを解析する必要がある私のコードです。
次に、 の行に沿って何かを使用して、webbrowser.open_new_tab(url)
各リンクで新しいタブを開きます (各ビデオのダウンロードを開始するために必要なのはこれだけです)。
Beautifulsoup は、この特定の URL へのリンクを取得するのに苦労しているようです。他のより単純なページでうまく機能します。問題が何であるかについてのアイデアはありますか?