2

JavaアプリケーションからいくつかのWebサイトをミラーリングする必要があります。この仕事をするためのオープンソースのJavaライブラリを探していましたが、適切なものが見つかりませんでした。

Webサイト全体を取得するためのJavaに適したツールについて知っている人はいますか、それともプログラムからexec wgetに固執する必要がありますか?

どうもありがとう。

4

2 に答える 2

1

この種のライブラリで私が見つけた最大の問題は、css解析がサポートされていないことでした。そのため、Webサイトをミラーリングするときに、インポートされたスタイルシートや背景画像などもダウンロードされます。

wgetにはこれに対するサポートが組み込まれています(少なくとも最近のバージョンでは)。Javaからこのプログラムを実行するのはあまりクリーンなソリューションではありませんが、最初に試して、ニーズに合うかどうかを確認します。

于 2010-10-19T22:22:44.603 に答える
0

クローラー/スパイダーをお勧めします。AspiderSperowiderは、Apache HttpClient lib(私のお気に入りのhttplib)を使用し、リンクをたどってサイトをクロールします。それらはOSSであるため、ソフトウェアに統合できるはずです。これらも現在メンテナンスされていませんが、Javaで独自のミラーリングツールを作成する場合は、ApacheHttpClientライブラリから始めるとよいでしょう。

于 2010-10-19T09:20:42.867 に答える