私は優れたツールである SimpleHTMLDOM Parser (http://simplehtmldom.sourceforge.net/) をいじっていますが、ボディ内から img 要素を収集する際に問題が発生しています。これは、次の例で最もよく説明されています。
同じ画像の 2 つの URL を次に示します。これらの URL でそれぞれ次のコードを実行します。
$html = $this->DOMParser->file_get_html($url);
foreach($html->find('img') as $element){
print($element->src);
}
http://imageshack.us/photo/my-images/412/71banksy89789ll7.jpg/
(SHTMLD はここで画像をピックアップします)
と
http://imageshack.us/scaled/landing/412/71banksy89789ll7.jpg
(SHTMLD は何も取得しません)
何が起こっているのかを把握するために数日間試みましたが、この例で唯一異なるのは html タグです。
何か案は?