-2

PHP を使用して Web ページのローカル コピーを作成したいと考えています。これは、mht のような Web アーカイブ、または画像と css を含む単なる html です。結果は、ブラウザで「名前を付けて保存」ボタンを押した場合とほぼ同じになるはずです:)

これを行うライブラリを見つけました: http://freecode.com/projects/php-save-complete-html-page 最後に、1 つの大きな html ファイルを作成しますが、非常に遅く動作し、非常に巨大なファイルを作成します。

私はネットでそのような解決策を見つけましたが、それも機能しません:

wget --no-parent --timestamping --convert-links --page-requisites --no-directories --no-host-directories -erobots=off http://cnn.com

画像を作成せず、css をダウンロードせず、html のみをダウンロードするだけです

Webページを完全にコピーしたり、外部ツールを見つけたり、API calを実行してMHTアーカイブを取得したりできるPHPライブラリを見つけたいと思います。

4

1 に答える 1

0

自分で書くには、curl を使用して外部 URL を検索し、それらを再帰的にたどることができると思います。そこに図書館があるかもしれません。

それ以外の場合は、exec()in php を使用してコマンドライン プログラムを実行できます。HTTrack は Web サイトの作成に優れています: http://www.httrack.com/html/fcguide.html

たとえば、次のようになります。

exec('httrack "http://www.all.net/" -O "/tmp/www.all.net" "+*.all.net/*" -v');

wgetさらに、 を使用したい場合は、動作するはずの一連のオプションを見つけました(試していないためと思われます)。

wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains example.com \
     --no-parent \
         www.example.com/directoryToArchive
于 2014-10-13T23:30:07.737 に答える