0

フォームフィールドをスクレイピングしている(または少なくとも試している)Webページがあります。Symfony2これを行うために(and Goutte) を使用しているので、$crawlerオブジェクトがあります。以下の html の例を次に示します。

<html>
<body> 
... other html stuff ...
<form method="post" action="goSomewhere">
<table>
    <tr><td><input type="checkbox" name="123">Stuff 1</td></tr>
    <tr><td><input type="checkbox" checked name="456">Stuff 2</td></tr>
    <tr><td><input type="checkbox" name="789">Stuff 3</td></tr>
</body> 
</html>

ご覧のとおり、ネストされたコンテンツが多数あります。私の興味は、<input>タグ内の<form></form>タグだけです。

私は次のようなことを試みています:

$query = "//form/input";
$inputs = $crawler->filterXPath($query);

しかし、すべての (そして唯一の) 入力タグを取得しているようには見えません。->count()50〜100個の入力タグがある場合、数として8個しか得られません。

これを行うための正しいクエリを取得するのを手伝ってくれる人はいますか?


また、それを取得したら、特定の入力を削除することに興味があります。Dom にこれを可能にするメソッドはありCrawlerますか? 私は多くの場所を見回しましたが、あまり見つけることができません。おそらく、逆フィルタリング システムを使用するとどうなるでしょうか。

助けてくれてありがとう!

4

0 に答える 0