親のdivクラスとすべてのリストアイテムを選択できますが、UPC番号を使用して特定のアイテムをキャプチャし、コンテンツとともにタグを削除しようとしています。「.parent」クラスの下のすべての子にIDまたはクラスがないことに注意してください。これは画面のスクレイピングであるため、何も追加する方法はありません。また、liの順序は変更される可能性があるため、カウントダウンはありません。
キャプチャのみを探しています...
000022200000
これは文字列/ウェブページです...
<div class="parent">
<ul>
<li>...</li>
<li><b>UPC:</b>000022200000</li>
(これらのupc#は明らかにすべて異なり、他のコンテンツは必要ありません)
SimpleHTMLDOMを使用してデータを解析しています...
foreach($shdom2->find('.parent ul li') as $e) {
$shdom = $shdom.'<p>UPC: '.$e.'</p>';
}
このループにより、すべてのリストアイテムが返されます。次に、UPC#のアイテムに絞り込む必要があります。
preg_match()を使用できると思いますが、preg_match()を機能させることができませんでした。
これは、プロジェクトのより単純なノードで機能したpreg_match()の使用です...
if (preg_match('/G00([^\/]*)/i', $e, $regs))
{
$r = $regs[0];
$shdom = $shdom.$r.',';
}