次の html スニペットがあります。
<h1 class="header" itemprop="name">Some text here<span class="nobr">
HTMLタグ間のテキストを取得したいのですが、これに何時間も苦労しています。助けてください! どの正規表現が私の問題を解決しますか?
次の html スニペットがあります。
<h1 class="header" itemprop="name">Some text here<span class="nobr">
HTMLタグ間のテキストを取得したいのですが、これに何時間も苦労しています。助けてください! どの正規表現が私の問題を解決しますか?
そのために正規表現を使用するべきではありませんが、HTML パーサーを使用する必要があります。言語を指定しなかったので、助けになりませんが、グーグルで見つけることができます...
この1つのケースだけで必要な場合は、正規表現を使用できます/>(.*?)</
Javascript では、次の方法でその情報にアクセスできます。
document.getElementsByTagName("h1").item(0).textContent
また
document.getElementsByClassName("header").item(0).textContent
他の人が言ったように、 HTML の解析に正規表現を使用するべきではありません。しかし、それはさておき、以下はそのテキストを取得します:
(?<=\>).+(?=\<)