simplehtmldom を使用して Web スクレイパーを作成しようとしています。タグの中身を検索してタグを取得したい。これは、タグのタイプではなく、その中の平文です。次に、プレーンテキストの内容を検索してタグを取得したら、その後に次のタグを取得したいと考えています。
コンテンツに基づいてタグを見つけるにはどうすればよいですか? そして、それを取得したら、次のタグを見つけるにはどうすればよいですか?
任意のヘルプをいただければ幸いです。
ありがとう。
simplehtmldom を使用して Web スクレイパーを作成しようとしています。タグの中身を検索してタグを取得したい。これは、タグのタイプではなく、その中の平文です。次に、プレーンテキストの内容を検索してタグを取得したら、その後に次のタグを取得したいと考えています。
コンテンツに基づいてタグを見つけるにはどうすればよいですか? そして、それを取得したら、次のタグを見つけるにはどうすればよいですか?
任意のヘルプをいただければ幸いです。
ありがとう。
以下は、すべてのテキスト ノードを検索し、次のタグを取得できるようにします。
// Use Simple_HTML_DOM special selector 'text'
// to retrieve all text nodes from the document
$textNodes = $html->find('text');
$foundTag = null;
foreach($textNodes as $textNode) {
if($textNode->plaintext == 'Hello World') {
// Get the parent of the text node
// (A text node is always a child of
// its container)
$foundTag = $textNode->parent();
break;
}
}
if($foundTag) {
$nextTagAfter = $foundTag->next_sibling();
}
これは、基本的な使用法に関する最初の質問ではありませんSimple_HTML_DOM
。公式ドキュメントを読むことをお勧めします。