のhtmlページを解析しGoogle play
て、アプリに関する情報を取得しようとしています。Simple-html-dom は完璧に機能しますが、ページにスペースのないコードが含まれている場合、属性は完全に無視されます。たとえば、html コードがあります。
<div class="doc-banner-icon"><img itemprop="image"src="https://lh5.ggpht.com/iRd4LyD13y5hdAkpGRSb0PWwFrfU8qfswGNY2wWYw9z9hcyYfhU9uVbmhJ1uqU7vbfw=w124"/></div>
ご覧のとおり、 と の間image
にスペースがないsrc
ため、 simple-html-dom はsrc
属性を無視して のみを返します<img itemprop="image">
。スペースを追加すると、完全に機能します。この属性を取得するには、次のコードを使用します。
foreach($html->find('div.doc-banner-icon') as $e){
foreach($e->find('img') as $i){
$bannerIcon = $i->src;
}
}
私の質問は、この美しいライブラリを変更して、これの完全な内部テキストを取得する方法div
ですか?