次の形式のデータを抽出したい:
<div class="image"><a href="[Any Chacter]">
データを取得しました<div class="image">
が、その後は結果がありません。これは私のコードです:
$tag_regex='/<div class="image">/';
preg_match_all($tag_regex,$xml,$matches);
return $matches[0];
次の形式のデータを抽出したい:
<div class="image"><a href="[Any Chacter]">
データを取得しました<div class="image">
が、その後は結果がありません。これは私のコードです:
$tag_regex='/<div class="image">/';
preg_match_all($tag_regex,$xml,$matches);
return $matches[0];
Truthがコメントで述べたように、htmlからデータを抽出する適切な方法はhtmlパーサーです。
ただし、ケースは単純であり、正規表現を使用して簡単かつ迅速に解決できます。
$tag_regex= '<div class="image"><a href=".*">';
preg_match_all($tag_regex,$xml,$matches);
return $matches[0];
あなたが学習にオープンであることがうれしいです、そして私はあなたがHTMLパーサーを使うことを学ぶことを本当に望んでいます(他の正気の人間のように)。
あなたの問題の実際的な解決のために:
$tag_regex= '|<div class="image"><a href="(.*)">|i';
preg_match_all($tag_regex,$xml,$matches);
return $matches[1]; //Will match what's in the first set of brackets, I.e the href.
このパターンは堅牢ではないことに注意してください。スペース、さまざまな種類の引用符、改行、およびその他の多くのものは考慮されていません。HTMLパーサーはそれらすべてを説明します。