<div id="title">
Post Title
</div>
<div id="post">
<a href="some link" id="buton">SOME LINK</a>
<a href="some link" id="buton">SOME OTHER LINK THAT I DONT WANT BUT HAS SAME ID</a>
</div>
私はsimple_html_domを使用して、公開Webサイトからいくつかの投稿をスクレイピングしようとしています。タイトルを簡単に取得できますがfind->div[id=title]
、投稿div内からの最初のリンクも必要です。そのdiv内のすべてのリンクには同じIDがありますそれぞれのタイトルと一緒に最初のものを取得するだけで少し問題が発生します。
xPath について聞いたことがあります。方法がわかれば使用しますが、まだ使用していません。