.html を pdf に変換する Java コードを書きたいと思っています。html から pdf への変換に adobe の itext API を使用しました。ただし、入力として不正な html ファイルを指定すると、この変換は失敗します。悪いhtmlをきれいにするが、新しいhtmlを再構築できるコードを取得できないパーサー.解析されたhtmlタグノードから新しいhtmlを構築する方法を知っている人はいますか?
1 に答える
0
HtmlCleaner には、たとえば次のように使用できる一連のシリアライザーが付属しています。
final HtmlCleaner cleaner = new HtmlCleaner();
final CleanerProperties properties = cleaner.getProperties();
final Serializer serializer = new SimpleHtmlSerializer(properties);
TagNode node = cleaner.clean("hello world");
StringWriter writer = new StringWriter();
serializer.write(node, writer, "UTF-8");
System.out.println(writer.toString());
于 2015-10-10T14:46:33.437 に答える