0

simplehtmldom を使用して Web スクレイパーを作成しようとしています。タグの中身を検索してタグを取得したい。これは、タグのタイプではなく、その中の平文です。次に、プレーンテキストの内容を検索してタグを取得したら、その後に次のタグを取得したいと考えています。

コンテンツに基づいてタグを見つけるにはどうすればよいですか? そして、それを取得したら、次のタグを見つけるにはどうすればよいですか?

任意のヘルプをいただければ幸いです。

ありがとう。

4

1 に答える 1

0

以下は、すべてのテキスト ノードを検索し、次のタグを取得できるようにします。

// Use Simple_HTML_DOM special selector 'text'
// to retrieve all text nodes from the document
$textNodes = $html->find('text');
$foundTag = null;

foreach($textNodes as $textNode) {
    if($textNode->plaintext == 'Hello World') {
        // Get the parent of the text node
        // (A text node is always a child of
        //  its container)
        $foundTag = $textNode->parent();
        break;
    }
}

if($foundTag) {
    $nextTagAfter = $foundTag->next_sibling();
}

これは、基本的な使用法に関する最初の質問ではありませんSimple_HTML_DOM公式ドキュメントを読むことをお勧めします。

于 2009-07-25T07:42:42.690 に答える