次のように作成されたWebページから情報をスクレイピングしたい
...
<div class="foo">
<span class="title">sometext</span>
<ul class="infos">
<li class="bar">
<a class="link" href="...">link1</a>
<img class="photo" src="..." />
</li>
<li class="bar">
<a class="link" href="...">link2</a>
<img class="photo" src="..." />
</li>
<li class="bar">
<a class="link" href="...">link3</a>
<img class="photo" src="..." />
</li>
</ul>
<span class="title">sometext2</span>
<ul class="infos">
<li class="bar">
<a class="link" href="...">link4</a>
<img class="photo" src="..." />
</li>
<li class="bar">
<a class="link" href="...">link5</a>
<img class="photo" src="..." />
</li>
</ul>
and so on...
</div>
...
しかし、次のような単純なリストを取得するために、情報のすべてのグループを循環する方法がわかりません
sometext:
- link1 imgsrc
- link2 imgsrc
- link3 imgsrc
sometext2:
- link4 imgsrc
- link5 imgsrc