私はhtmlページを持っています。文/テキストの最後に疑問符があるタグ内のテキストのみを抽出したい。私が使用:
<.+?>(.+?)<.+?>
タグ内のテキストを取得します。しかし、これには 2 つの問題があります: 1- ネストされたすべてのタグも抽出されますが、これは望ましくありません。 .
これを行う方法がわかりません。誰か助けてください(Javaで)。PS: 私が持っている HTML ページの形式が正しくないため、JSoup などのツールを使用することはできません。そのため、正規表現のみを使用しています。