0
<div id="title">
Post Title
</div>

<div id="post">
<a href="some link" id="buton">SOME LINK</a>
<a href="some link" id="buton">SOME OTHER LINK THAT I DONT WANT BUT HAS SAME ID</a>
</div>

私はsimple_html_domを使用して、公開Webサイトからいくつかの投稿をスクレイピングしようとしています。タイトルを簡単に取得できますがfind->div[id=title]、投稿div内からの最初のリンクも必要です。そのdiv内のすべてのリンクには同じIDがありますそれぞれのタイトルと一緒に最初のものを取得するだけで少し問題が発生します。

xPath について聞いたことがあります。方法がわかれば使用しますが、まだ使用していません。

4

2 に答える 2

0

xpathがなくても、最初の例を考えると、次のような些細なことをできるはずです

find->div[id=post]

次に、子供を求め、そこから最初の子供を選択します。

于 2013-05-07T04:08:49.293 に答える
0

それは次のようになります。

$doc->find('div#post a', 0);
于 2013-05-07T06:33:42.663 に答える