python-3.x - BeautifulSoup で作成されたリストから特定のテキストを抽出する方法

翻译自：https://stackoverflow.com/questions/53016774 2018-10-26T21:58:27.823

28 次

だから私はページからダウンロードリンクのリストを取得したいと思います:

soup = BeautifulSoup(driver.page_source)
linky=soup.find_all(name='a', href=re.compile('download.php'))

これにより、すべてのリンクのリストが返されます。

[<a href="download.php/947983/adam.zip"><img "="" alt="Download" src="browse_dl.png" style="style=" title="Download Adam"/></a>,
<a href="download.php/947981/barb.zip"><img "="" alt="Download" src="browse_dl.png" style="style=" title="Download Barb"/></a>,
<a href="download.php/947972/chris.zip"><img "="" alt="Download" src="browse_dl.png" style="style=" title="Download Chris"/></a>,
<a href="download.php/947971/dan.zip"><img "="" alt="Download" src="browse_dl.png" style="style=" title="Download Dan"/></a>]

「ダウンロード」の後にhrefリンクとimgタイトルを抽出して、タプルに入れたいと思います。

したがって、次のようなリストがあります。

[(download.php/947983/adam.zip, Adam)
(download.php/947981/barb.zip, Barb),
(download.php/947972/chris.zip, Chris),
(download.php/947971/dan.zip, Dan)]

アイテムごとにテキストを href=" と "img に分割するだけでよいと思ったのですが、その方法がわかりません。次の問題は、タイトルも抽出するにはどうすればよいかということです。

python-3.x - BeautifulSoup で作成されたリストから特定のテキストを抽出する方法

1 に答える 1

Related

Reference