-1

私がやりたいことを説明するのが難しいので、最初に申し訳ありません。

PHPでクローラーを作成し、関数getElementsByTag()を使用して必要なタグを取得しています。たとえば、Webサイトからimgを取得したいのですが、クラスごとに分類されていないため、フィルタリングできません。コードは次のとおりです。

<div class="separator" style="clear: both; text-align: center;">
<a href="www.xxx.com" target="_blank"><img alt="Athletic de Bilbao" border="0" src="http://2.bp.blogspot.com/-2UBftyhYArw/T0v9vguvZuI/AAAAAAAAA9s/vLQ8GSo6v5A/s1600/athletic.png" title="Athletic de Bilbao" /></a></div>
<img border="0" src="www.xxx.com/TOl2NhAAFBI/AAAAAAAAAJk/KxHrumDQ48M/s1600/down.gif" /> <b style="color: red;">Bajas</b> <br />
<ul>

私が得た1つのチャンスは、タグdiv(セパレーター)を取得してから、任意の関数で内部のイメージタグにアクセスすることだと思いますが、関数でできるかどうかわかりませんか?

4

1 に答える 1

1

これをXpath 式として記述できます。たとえば、そのようなすべての画像のリストを取得できます。

//div[@class="separator"]/img

を使用して、PHP で xpath 式を実行できますDOMXPath

と同様にDOMDocument::getElementsByTagName()、もDOMXPath::query()返しますDOMNodeList

于 2012-12-31T16:32:20.123 に答える