Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
<h1>タグの内容を取得する正規表現を作成したいと考えています。
<h1>
たとえば、キャプチャしたい
<h1>All of this in here no matter what 雷 א 格 ןןד i$ </h1>
ただし、実際のタグは必要ありません。<h1>内部のものだけです(外国の文字を含む)
特別な条件、ルックアラウンド、グループなど、非常に複雑な答えがたくさんあります。タグの中身を探しています。それでおしまい。
この正規表現パターンを使用
(?<=<h1>).*?(?=<\\/h1>)
String#replaceAll次のように使用できます。
String#replaceAll
String h1text = html.replaceAll("(?ui)<h1>(.*?)</h1>", "$1");
?uUnicode 文字の処理と?i大文字と小文字の一致の無視について注意してください。
?u
?i