プログラムで Web ページを保存したいと思います。
単に HTML を保存するという意味ではありません。また、関連するすべてのファイル (画像、CSS ファイル、埋め込み SWF など) を自動的に保存し、できればローカル ブラウジング用のリンクを書き換えたいと考えています。
意図された用途は、元のコピーが削除された場合に備えてリンク コンテンツがキャッシュされる、個人のブックマーク アプリケーションです。
プログラムで Web ページを保存したいと思います。
単に HTML を保存するという意味ではありません。また、関連するすべてのファイル (画像、CSS ファイル、埋め込み SWF など) を自動的に保存し、できればローカル ブラウジング用のリンクを書き換えたいと考えています。
意図された用途は、元のコピーが削除された場合に備えてリンク コンテンツがキャッシュされる、個人のブックマーク アプリケーションです。
wget、特に -p フラグを見てください
−p −−page−requisites
This option causes Wget to download all the files
that are necessary to properly display
a givenHTML page. Thisincludes such
things as inlined images, sounds, and
referenced stylesheets.
次のコマンド:
wget -p http://<site>/1.html
page.html と必要なすべてのファイルをダウンロードします。
Windows の場合: IE を com オブジェクトとして実行し、すべてを引き出すことができます。
また、Mozilla のソースを取得することもできます。
Java では、ロボ.
または、commons-httpclient を実行して、多くのコードを記述します。
MHTML 形式 (IE が使用する形式) を試すことができます。http://en.wikipedia.org/wiki/MHTML
つまり、各オブジェクト (画像、CSS など) をコンピューターにダウンロードし、Base64 経由でそれらを 1 つのファイルに "埋め込む" ことになります。