-3

この行のアンカー終了タグ内でランダムに出現する単語を除いて、すべてのhtmlタグテキスト番号すべてを選択するための文字列が必要ですrel="bookmark">RANDOM WORDS</a></h1>

文字通りすべてを選択する文字列を試してみました[<0-9a-zA-z/=|"-:.*?>]が、それで問題ないことがわかりましたが、上記の行内にある選択で、ランダムワードを除外する文字列が必要です。

4

1 に答える 1

1

正規表現は、この仕事に適したツールではありません。XML / HTML DOMパーサーの使用を検討し、その方法で必要な情報を抽出してください。

このタスクを実行するためのRegExの作成で問題が発生する理由は、HTMLマークアップ言語が正規表現ではないためです。したがって、正規表現での処理には適していません。

于 2013-02-20T16:27:31.673 に答える