java - HTML に特殊文字や不正な文字が含まれていると、Html からの IText Pdf の作成に失敗する

翻译自：https://stackoverflow.com/questions/26054659 2014-09-26T07:53:49.350

1831 次

itext を使用して、html コンテンツから pdf を作成しています。Java String バッファを使用して、テーブルの形式で html コンテンツを作成します。Map には、ファイルのメタデータ値がキーと値のペアの形式で含まれています。これらのキーと値を反復処理して、html テーブルを作成します。問題は、マップ内のメタデータ値の一部が意味のない/無効なシンボルであることです。そのため、pdf の作成は次の例外で失敗します。

java.io.IOException: Expected > for tag: <{1}/> near line 1, column 717
at com.lowagie.text.xml.simpleparser.SimpleXMLParser.throwException(SimpleXMLParser.java:568)
    at com.lowagie.text.xml.simpleparser.SimpleXMLParser.go(SimpleXMLParser.java:331)
    at com.lowagie.text.xml.simpleparser.SimpleXMLParser.parse(SimpleXMLParser.java:579)
    at com.lowagie.text.html.simpleparser.HTMLWorker.parse(HTMLWorker.java:141)


Content which caused the exception is 
“$é6èŽšÆuCÅ ©À SÀF;r 1Ì/XQ‡,Ô<ÒÐ"‡(¢ËÄòÅ1¡Ø€ÌÅc

だから私の質問は、これらの文字は何ですか(非ASCII、utf-unsupported)? HTMLの構築中にそれらを識別してスキップする方法はありますか?

java - HTML に特殊文字や不正な文字が含まれていると、Html からの IText Pdf の作成に失敗する

1 に答える 1

Related

Reference