0

そのため、さまざまな種類の html タグ内のテキストに一致する正規表現を作成しようとしています。次のいずれの場合も、太字のテキストと一致する必要があります。

<div class="username_container">
        <div class="popupmenu memberaction">
        <a rel="nofollow" class="username offline " href="http://URL/surfergal.html" title="Surfergal is offline"><strong><!-- google_ad_section_start(weight=ignore) -->**Surfergal**<!-- google_ad_section_end --></strong></a>
</div>



<div class="username_container">
        <span class="username guest"><b><a>**Advertisement**</a></b></span>
</div>

結果なしで次の正規表現を試しました:

/<div class="username_container">.*?((?<=^|>)[^><]+?(?=<|$)).*?<\/div>/is

ここでスタックオーバーフローに投稿するのはこれが初めてなので、信じられないほど愚かなことをしている場合は、謝罪することしかできません。

4

1 に答える 1

0

正規表現を使用して html を解析するのは..難しいです。質問へのコメントのリンクを参照してください。

これらの試合で何をする予定ですか?コンソールに結果を記録する簡単な jquery スクリプトを次に示します。

var a = [];
$('strong, b').each(function(){
    a.push($(this).html());
});

console.log(a);

結果:

["<!-- google_ad_section_start(weight=ignore) -->**Surfergal**<!-- google_ad_section_end -->", "<a>**Advertisement**</a>"] ​

http://jsfiddle.net/Mk7xf/

于 2012-07-05T12:54:24.007 に答える