以下は私のコードです。html のイメージ タグ内のイメージの src を取得しようとします。
import re
for text in open('site.html'):
matches = re.findall(r'\ssrc="([^"]+)"', text)
matches = ' '.join(matches)
print(matches)
問題は、次のようなものを入れるときです:
<img src="asdfasdf">
動作しますが、HTML ページ全体を挿入すると何も返されません。なぜそれをするのですか?どうすれば修正できますか?
Site.html は、標準形式の Web サイトの HTML コードです。すべてを無視して、画像のソース コードのみを出力するようにします。site.html の内容を確認したい場合は、基本的な HTML Web ページに移動し、すべてのソース コードをコピーします。