URLを渡して、ブラウザの場合と同じようにWebページの画像を作成できる最高のJavaライブラリを探しています。私はflyingsaucerを試しました が、ほとんどすべてのWebページがそれを壊しているようです-www.google.comやyahoo.comもレンダリングしません-レンダリングできる唯一のサイトはwww.w3c.orgです!
使用するためのより良いツールについての考え、またはおそらくxhtmlでフライングソーサーをより緩くすることを許可することは受け入れられますか?
URLを渡して、ブラウザの場合と同じようにWebページの画像を作成できる最高のJavaライブラリを探しています。私はflyingsaucerを試しました が、ほとんどすべてのWebページがそれを壊しているようです-www.google.comやyahoo.comもレンダリングしません-レンダリングできる唯一のサイトはwww.w3c.orgです!
使用するためのより良いツールについての考え、またはおそらくxhtmlでフライングソーサーをより緩くすることを許可することは受け入れられますか?
Flying Saucerはxhtmlしか許可しないため、多くのページで失敗します(マニュアルを参照)。
ただし、いくつかのhtmlライブラリを使用して入力を「クリーン」にしてからFSを使用することができます。
Webesite->「クリーナー」->フライングソーサー
いくつかの良い無料のライブラリは次のとおりです。
itext.jarを試すことができるかもしれません
http://itextpdf.com/download.phpからダウンロードしてください
HTMLクロールについて:
JavaライブラリのURLを使用します。これについてはたくさんの例があります。
PDF変換について:
Springフレームワークを使用している場合は、iTextAPIを介してAbstractPdfViewクラスを使用できます。これは私のお気に入りの例です。簡単に利用できると思います。
画像変換について:
私はこれをお勧めします:http ://code.google.com/p/java-html2image/
合計:
URLでhtmlを読む→iTextまたはjava-html2imageで変換します。特定の図書館に任せるのではなく、自分でやることを強くお勧めします。