0

私はまだ正規表現で遊んだことがなく、文字列の一部だけを見つけるための助けを探していました。

img タグの例:

<img border="0" alt="background, images, scarica, adobe, art, rainbow, colorful, wallpaper, tutorial, abstract, photoshop, web, pictures, wallpapers" width="192" height="120" class="h_120" src="http://static.hdw.eweb4.com/media/thumbs/1/74/736679.jpg" />

大きなhtmlファイルからsrcのURLを取得しようとしています。

4

1 に答える 1

2

使用BeautifulSoup:

from bs4 import BeautifulSoup

soup = BeautifulSoup(html_doc)
page_images = [image["src"] for image in soup.findAll("img")]

以下を使用してインストールBeautifulSoupします。pip install beautifulsoup4

于 2013-03-07T19:23:42.320 に答える