4

Javaを使用して「無効な」HTMLファイルからPDF(または任意の画像形式[ png、jpg、bmp ..])を作成したい。私はそれをグーグルで検索し、ツールを見つけました:iText、およびiTextを使用してJavaでHTMLからPDFを作成するチュートリアルのいくつか。

このチュートリアルでは、Javaを使用した(X)HTMLからPDFへの変換で、有効なHTMLに対して正しく機能し、このようなPDFファイルがありました。しかし、HTMLからPDFを作成しようとすると、いくつかのエラーが発生しました。

まず第一に、私のHTMLは整形式ではなく、残念ながら変更することはできません。ここにアップロードしたところ、W3Cのバリデーターが28個のエラーを検出しました。

私のオプションは次のとおりです。

  • まず、HTMLをクリーンアップして有効にし、すぐにPDFを作成します。
  • 別のツールを見つけてください(私の問題に有効です)。
  • あなたの提案(Javaを使用)。
  • 最後のオプション。別のプラットフォーム(.net、Php、Pythonなど)を使用し、アプリケーションのWebサービスを使用します。

この問題について私を助けてください。前もって感謝します

4

3 に答える 3

4

http://jtidy.sourceforge.net/などのツールを使用してHTMLを修正し、jTidyの出力に対してiTextを実行できます...

于 2012-06-04T11:58:19.103 に答える
2

jsoupなどの壊れたHTMLをサポートするHTMLパーサーを使用できます。

jtidyと同様に、有効なHTMLを自動的に作成できますが、HTML DOMを操作することもできるため、最大の問題を自分で明示的に修正することができます。

于 2012-06-04T13:41:39.040 に答える
2

試してみてくださいwkhtmltopdf。これは、ヘッドレスブラウザ(webkit)を使用して最初にhtmlをレンダリングし、次にPDFを生成します。私はこれを私のJavaプロジェクトの1つで使用していて、うまく機能しました。

いくつかの柔軟なコマンドラインオプションを提供します。オプションのリストとその使用法のリンクは次のとおりです。これは、整形式ではないhtmlでも機能します。

于 2012-06-08T14:24:03.323 に答える