</b>
PHP のDOMDocument->loadHTML()システムを使用して、次のデータ (タグの 4.0m 後) を取得する最良の方法は何でしょうか? ある種のCSSスタイルのセレクターだと思いますか?
(LINE 240, always 240) <b>Current Price:</b> 4.0m
私はドキュメントを見回してきましたが、正直なところ、これは私にとって完全に異質です! さらに、次のような URL から、何千ものページのこのデータを取得するにはどうすればよいでしょうか。
http://site.com/q=item/viewitem.php?obj=11928
最小値/最大値はわかっています(obj=#
スクレイピングする必要があるページの数)。それらすべてを段階的に取得し、MySQL データベースに出力name
description
しますprice
(現時点では、パーセンテージの上昇/低下についてはあまり心配していません)。 、そこから取得して自分のサイトに表示できます。
私が興味を持っているコードのメインブロックは次のとおりです。
<div class="subsectionHeader">
<h2>
Item Name
</h2>
</div>
<div id="item_additional" class="inner_brown_box">
Description of item goes here.
<br>
<br>
<b>Current Price:</b> 4.0m
<br><br>
<b>Change in Price:</b><br>
<span>
<b>30 Days:</b> <span class="rise">+2.5%</span>
</span>
<span class="spaced_span">
<b>90 Days:</b> <span class="drop">-30.4%</span>
</span>
<span class="spaced-span">
<b>180 Days:</b> <span class="drop">-33.3%</span>
</span>
<br class="clear">
</div> </div> <div class="brown_box main_page">
<div class="subsectionHeader"> `
誰かがこれをどうやって進めるかについての骨の折れるヒントを提供できれば、それは大歓迎です!