1

wget を使用して、Web サイトからすべての画像を簡単にダウンロードできます。

しかし、クライアント側でこの機能が必要です。Java が最適です。

wget のソースにオンラインでアクセスできることは知っていますが、C の知識がなく、ソースが非常に複雑です。もちろん、wgetには「ソースを爆破する」他の機能もあります。

Java には組み込みの がありHttpClientますが、wget が実際にどれほど洗練されているかはわかりませんが、Java で「すべての画像を再帰的にダウンロードする」機能を再実装するのは難しいかどうか教えてください。

これはどのように行われますか?wget は指定された URL の HTML ソース コードを取得し、指定されたファイル末尾 (.jpg、.png) を持つすべての URL を HTML から抽出してダウンロードしますか? その HTML ドキュメントにリンクされているスタイルシートの画像も検索しますか?

これをどのように行いますか?正規表現を使用して HTML ドキュメント内の (相対および絶対) 画像 URL を検索し、HttpClientそれぞれをダウンロードしますか? それとも、似たようなことをするJavaライブラリがすでにありますか?

4

3 に答える 3