Lxml を使用して Python 経由で解析する HTML ページがあります。問題は、class 属性や id 属性がない HTML イメージ タグの値を取得する必要があることです。このような:
<table cellspacing="0" cellpadding="0" border="0">
<tbody><tr>
<td align="left" valign="top" style="padding: 0 10px 0 60px;">
<img src="/files/135.jpg" width="64" height="64">
</td>
<td align="left" valign="middle"><h1>Archer / Арчер</h1>
</td>
</tr>
</tbody></table>
それで、私の仕事を解決するために、私は質問があります-このHTMLから画像タグを選択するjqueryのような式を書くことが可能ですか、またはすべてのimgタグを反復して属性を抽出し、特定の幅と高さを持つsrc属性を取得する必要があります?