3

アンカーと特定のテキストを一致させるPHPの正規表現を探しています。たとえば、次のようなテキストmylinkを含むアンカーを取得したいと思います。

<a href="blabla" ... >mylink</a>

したがって、すべてのアンカーと一致する必要がありますが、特定のテキストが含まれている場合に限ります。したがって、これらの文字列と一致する必要があります。

<a href="blabla" ... >mylink</a>

<a href="blabla" ... >blabla mylink</a>

<a href="blabla" ... >mylink bla bla</a>

<a href="blabla" ... >bla bla mylink bla bla</a>

しかし、これではありません:

<a href="blabla" ... >bla bla bla bla</a>

これはmylinkという単語が含まれていないためです。

また、これは一致しないはず"mylink is string"です。アンカーではないためです。

誰かアイデアはありますか?

Thanx Granit

4

4 に答える 4

9

代わりにパーサーを試してください。

require_once "simple_html_dom.php";

$data = 'Hi, I am looking for a regular expression in PHP which would match the anchor with a 
specific text on it. E.g I would like to get anchors with text mylink like: 
<a href="blabla" ... >mylink</a>

So it should match all anchors but only if they contain specific text So it should match t
hese string:

<a href="blabla" ... >mylink</a>

<a href="blabla" ... >blabla mylink</a>

<a href="blabla" ... >mylink bla bla</a>

<a href="blabla" ... >bla bla mylink bla bla</a>

but not this one:

<a href="blabla" ... >bla bla bla bla</a> Because this one does not contain word mylink.

Also this one should not match: "mylink is string" because it is not an anchor.

Anybody any Idea? Thanx Granit';

$html = str_get_html($data);

foreach($html->find('a') as $element) {
  if(strpos($element->innertext, 'mylink') === false) {
    echo 'Ignored: ' . $element->innertext . "\n";
  } else {
    echo 'Matched: ' . $element->innertext . "\n";
  }
}

これは出力を生成します:

Matched: mylink
Matched: mylink
Matched: blabla mylink
Matched: mylink bla bla
Matched: bla bla mylink bla bla
Ignored: bla bla bla bla

ダウンロード元simple_html_dom.phphttp ://simplehtmldom.sourceforge.net/

于 2009-11-02T13:16:49.917 に答える
1

これはうまくいくはずです(正規表現文字列を作成し、「mylink」の代わりに必要な文字列を挿入します)

<\s*a\s+[^>]*>[^<>]*mylink[^<>]*<\s*\/a\s*>

しかし、これはお勧めできません。代わりに HTML パーサーを使用して、タグを処理する必要があります。正規表現は、これに適したツールではありません。(まれに ">" を含むリンクがある場合、上記の正規表現は機能しません)

適切なラップアラウンドを使用するだけであれば、phpは特別なエスケープ文字を必要としないと思います。

regexpal.com でテスト済み

いくつかの注意事項::
\s* - オプションの空白に一致するには
\s+ - 少なくとも 1 つのスペース/タブと追加のオプションの空白に
一致するには [^>] - '>' を除く任意の文字に一致します
[^<>]- 以外の任意の文字に一致します「<」または「>」

更新: m/regex/ と一致する php の「/」をエスケープしました

于 2009-11-02T13:09:50.080 に答える
0
if (preg_match('%<\s*a\s+href="blabla"[^>]*>(.*mylink.*)<\s*/a>%', $text, $regs)) {
    $result = $regs[1];
} else {
    $result = "";
}

$regs[0]完全一致 $regs[1]を保持します a タグ内のビットを保持します

于 2009-11-02T13:10:03.427 に答える
0
/<a[^>]*>([^<]*mylink[^<]*)<\/a>/

タグがリンク ( ) 内にあると壊れてしまうため、少し単純化されていますが、<a href="/xyz">xyz <i>mylink</i> aaa</a>動作するはずです。

于 2009-11-02T13:10:41.030 に答える