PHP Simple HTML DOM Parser を使用して Web ショップの一部のデータをスクレイピングしています (PHP5.3.0 で XAMPP 1.7.2 も実行しています) <tbody>
。タグで問題が発生しています。テーブルの構造は基本的に次のとおりです (詳細はそれほど重要ではありません)。
<table>
<thead>
<!--text here-->
</thead>
<tbody>
<!--text here-->
</tbody>
</table>
今、私は<tbody>
コードを使用してセクションに到達しようとしています:
$element = $html->find('tbody',0)->innertext;
エラーはスローされません。エコーしようとしても何も出力されません。私は他の要素でコードをテストしまし<thead>
た。それらはすべて正しいセクションを提供します。外文同上。しかし、それはすべて失敗します。<table>
<span class="price">
<tbody>
今、私はパーサーにざっと目を通しましたが、それを理解できるかどうかはわかりません. 言及されていないことに気付きました<thead>
が、うまく機能します。肩をすくめる
子ナビゲーションを試してみることもできると思いますが、それも不具合があるようです。実行してみました:
$el = $html->find('table',0);
$el2 = $el->children(2);
echo $el2->outertext;
そしてサイコロはありません。と 2 を 1 に置き換えてみましchildren
たがfirst_child
、まだダイスはありません。面白いですが、->find
の代わりに試してみるとchildren
、完全に機能します。
全体の回避策を見つけることができると確信していますが、この動作はここに投稿するのに十分奇妙に思えます。私の好奇心旺盛な心は、得られるすべての助けに満足しています。