3

URLを渡して、ブラウザの場合と同じようにWebページの画像を作成できる最高のJavaライブラリを探しています。私はflyingsaucerを試しました が、ほとんどすべてのWebページがそれを壊しているようです-www.google.comやyahoo.comもレンダリングしません-レンダリングできる唯一のサイトはwww.w3c.orgです!

使用するためのより良いツールについての考え、またはおそらくxhtmlでフライングソーサーをより緩くすることを許可することは受け入れられますか?

4

3 に答える 3

5

Flying Saucerはxhtmlしか許可しないため、多くのページで失敗します(マニュアルを参照)。

ただし、いくつかのhtmlライブラリを使用して入力を「クリーン」にしてからFSを使用することができます。

Webesite->「クリーナー」->フライングソーサー

いくつかの良い無料のライブラリは次のとおりです。

  1. JSoup(個人的な推薦)
  2. HtmlCleaner
  3. JTidy(必要以上に厳しい場合もあります)
  4. Jericho HTML
于 2012-08-27T13:29:50.437 に答える
0

itext.jarを試すことができるかもしれません

http://itextpdf.com/download.phpからダウンロードしてください

于 2012-04-24T03:39:56.953 に答える
0

HTMLクロールについて:

JavaライブラリのURLを使用します。これについてはたくさんの例があります。

PDF変換について:

Springフレームワークを使用している場合は、iTextAPIを介してAbstractPdfViewクラスを使用できます。これは私のお気に入りの例です。簡単に利用できると思います。

画像変換について:

私はこれをお勧めします:http ://code.google.com/p/java-html2image/

合計:

URLでhtmlを読む→iTextまたはjava-html2imageで変換します。特定の図書館に任せるのではなく、自分でやることを強くお勧めします。

于 2012-04-24T03:45:23.150 に答える