Java の JPedal ライブラリは、通常、pdf を XML または HTML に変換するために使用されます。しかし、HTML5 ドキュメントからデータを抽出し、JPedal ライブラリ API を使用して XML に保存できるかどうかを知る必要がありました。これに代わる他の可能な方法はありますか?
また、Java を使用して HTML5 ドキュメントを解析し、XML に保存しようとしています。特定のタグだけを見つけて、それらから XML をレンダリングする良い解決策はありますか?
教えてください。ありがとうございました。