JavaでPDFドキュメントを単一のHTMLファイルに変換しようとしています。オンラインのほとんどのコンバーターは、1 つの PDF ファイルを複数の HTML ファイルに変換します。PDF全体を単一のHTMLファイルに変換したい。
助言がありますか?
JavaでPDFドキュメントを単一のHTMLファイルに変換しようとしています。オンラインのほとんどのコンバーターは、1 つの PDF ファイルを複数の HTML ファイルに変換します。PDF全体を単一のHTMLファイルに変換したい。
助言がありますか?
助言がありますか?
複数の HTML ファイルのそれぞれを組み込んだ 1 つのドキュメントを作成するために、 JSoup API を使用して何らかのコードを作成することがあります。body
スタイルとスタイル シート (CSS) を組み合わせるのは少し難しいかもしれません (特に元の HTML が 'id' 要素を使用している場合)。
「単一のドキュメント」がオプションであるコンバーターがそこにないとは信じがたいですが。さらに検索することをお勧めします。
PDFドキュメントをitextで解析してからhtmlファイルを生成できるはずだと思います。ただし、それが実行可能かどうかを確認していないことを認めなければなりません。
単一のファイルに書き込むオプションがあるhttp://www.jpedal.org/html_index.phpを見たことがありますか。