HTML の解析に正規表現を使用することは避けるべきです。特に、これを行うための非常に強力なツールがすべてのブラウザーに組み込まれています。
これは正規表現を使用しないソリューションです。かなり単純だと思います。
仕組みは次のとおりです。
- HTML要素を作成します
- ブラウザーには、非常に優れた HTML パーサーが既に含まれています :) これは、Web ページの場合と同様に、名前のスペース、エスケープされたエンティティ、部分的な HTML などのエッジ ケースを処理します。要素に HTML をダンプします。
- querySelector 構文を使用して要素をクエリできます。または、古いファッションの男であれば、さらに単純な getElementsByTagName を使用できます。
textContent
プロパティを使用してテキストを取得します。
実際のコード:
var test = '<b><font color="#32748">My string:</font></b><big> My value </big><br>';
// we create an empty element and put the html in it
var div = document.createElement("div");
div.innerHTML = test;
// get the text from the font tag, as you asked for.
var test = div.querySelector("font").textContent;
<font>
タグは非推奨であり、新しいコードでは使用しないでください。現在の HTML5 仕様を調べて、最新の HTML でどのように機能するかを確認することを検討します。
注 2、oldIE では使用できないため、 or を実行できtextContent
ます。innerHTML
innerText