HTML モックアップをスクレイピングしてページの完全性を維持できるLinux application
(または Firefox 拡張機能)を探しています。
Firefox はほぼ完璧に機能しますが、CSS で参照されている画像を取得しません。
Firefox の Scrapbook 拡張機能はすべてを取得しますが、ディレクトリ構造をフラット化します。
すべてのフォルダがページの子になったとしても、まったく気にしませんindex
。
HTML モックアップをスクレイピングしてページの完全性を維持できるLinux application
(または Firefox 拡張機能)を探しています。
Firefox はほぼ完璧に機能しますが、CSS で参照されている画像を取得しません。
Firefox の Scrapbook 拡張機能はすべてを取得しますが、ディレクトリ構造をフラット化します。
すべてのフォルダがページの子になったとしても、まったく気にしませんindex
。
wget を使用した Web サイトのミラーリングを参照してください。
wget --mirror –w 2 –p --HTML-extension –-convert-links http://www.yourdomain.com
wgetを試しましたか?
wget -r
必要なことを行いますが、そうでない場合は、それを構成するためのフラグがたくさんあります。を参照してくださいman wget
。
もう 1 つのオプションはcurl
、さらに強力な です。http://curl.haxx.se/を参照してください。
Teleport Proは、この種の作業に最適です。完全な Web サイトを指定すると、コピーがローカルにダウンロードされ、ディレクトリ構造が維持され、必要に応じて絶対リンクが相対リンクに置き換えられます。元のサイトからリンクされている他のサードパーティの Web サイトのコンテンツが必要かどうかを指定することもできます。