誤ってエスケープされた属性値を持つ任意の大きな HTML 文字列があります。適切にエスケープされた属性値を含む完全な HTML 文字列を取得したいと考えています。Javaでこれをやりたいです。
たとえば、次の誤ってエスケープされた HTML タグがあるとします。
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
私はこの出力が欲しい:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
StringEscapeUtils.escapeHtml() または replaceAll() は、すべての無効な HTML 文字を次のように置き換えます。
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
属性値内の文字を適切にエスケープしたいのですが、残りの HTML はそのままにして、ブラウザーで適切に処理できるようにします。この問題を処理できる Java ライブラリはありますか?