H1タグを渡された画像を見つけようとしています。マークアップは、オンライン マガジンの任意の記事にすることができます (例)。つまり、特定のコンテナーなどに依存することはできません。
私の最初のアイデアは、H1 タグの文字位置と見つかった画像を見つけることでした。これにより、H1 タグに対する位置を特定できます。何かが欠けていない限り、美しいスープで見つかった要素の文字位置を取得する方法が見つかりません。
html を解析するためにどのようなアプローチを使用する必要があるとしても、形式が正しくない構文で動作する必要があります。
例:
<html>
<p>some text</p>
<img src="#" alt="I don't care about this image"/>
<h1>This is the title</h1>
<img src="#" alt="This is the first image I want to get"/>
<p>some more content</p>
<img src="#" alt="This is the secod image I want to get"/>
</html>
上記の HTML を解析すると、H1 タグの下にある 2 つの画像のリストが返されます。
更新:問題をよりよく説明するために、質問を完全に書き直しました。