wget を使用して、Web サイトからすべての画像を簡単にダウンロードできます。
しかし、クライアント側でこの機能が必要です。Java が最適です。
wget のソースにオンラインでアクセスできることは知っていますが、C の知識がなく、ソースが非常に複雑です。もちろん、wgetには「ソースを爆破する」他の機能もあります。
Java には組み込みの がありHttpClient
ますが、wget が実際にどれほど洗練されているかはわかりませんが、Java で「すべての画像を再帰的にダウンロードする」機能を再実装するのは難しいかどうか教えてください。
これはどのように行われますか?wget は指定された URL の HTML ソース コードを取得し、指定されたファイル末尾 (.jpg、.png) を持つすべての URL を HTML から抽出してダウンロードしますか? その HTML ドキュメントにリンクされているスタイルシートの画像も検索しますか?
これをどのように行いますか?正規表現を使用して HTML ドキュメント内の (相対および絶対) 画像 URL を検索し、HttpClient
それぞれをダウンロードしますか? それとも、似たようなことをするJavaライブラリがすでにありますか?