1

私は優れたツールである SimpleHTMLDOM Parser (http://simplehtmldom.sourceforge.net/) をいじっていますが、ボディ内から img 要素を収集する際に問題が発生しています。これは、次の例で最もよく説明されています。

同じ画像の 2 つの URL を次に示します。これらの URL でそれぞれ次のコードを実行します。

$html = $this->DOMParser->file_get_html($url);

foreach($html->find('img') as $element){
   print($element->src);
}

http://imageshack.us/photo/my-images/412/71banksy89789ll7.jpg/

(SHTMLD はここで画像をピックアップします)

http://imageshack.us/scaled/landing/412/71banksy89789ll7.jpg

(SHTMLD は何も取得しません)

何が起こっているのかを把握するために数日間試みましたが、この例で唯一異なるのは html タグです。

何か案は?

4

2 に答える 2

0

シンプルです。2番目のURLはHTMLではなく、Jpgです。:)

于 2012-12-10T19:41:33.160 に答える
0

2 番目の URL は、img タグを含む html ページではなく、jpeg ファイルを直接指しています。SimpleHTMLDOM パーサーは html ページのみを解析できるため、html ページではなく画像ファイルを渡すと機能しません。

于 2012-12-10T19:38:32.287 に答える