52

wget で Web サイトのセクション (ルートの下のフォルダー パス) をミラーリングすることができません。Web サイトのホームページからのみ動作するようです。

私は多くのオプションを試しました - ここに一例があります

wget -rkp -l3 -np  http://somewebsite/subpath/down/here/

その URL の下にあるコンテンツ リンクをミラーリングしたいだけですが、そのパスにないすべてのページ アセットもダウンロードする必要があります。

ホームページ ( /) では問題なく動作しているようですが、サブ フォルダーではうまくいきません。

4

4 に答える 4

89

次の例のように、--mirror( -m) および--no-parent( -np) オプションに加えて、いくつかの優れたオプションを使用します。

wget --mirror --page-requisites --adjust-extension --no-parent --convert-links
     --directory-prefix=sousers http://stackoverflow.com/users
于 2011-08-04T04:14:01.260 に答える
19

私は通常使用します:

wget -m -np -p $url
于 2011-05-26T22:11:03.407 に答える
3

私はミラーを実現するために pavuk を使用しています。次のようなものを使用できます。

/usr/bin/pavuk -enable_js -fnrules F '*.php?*' '%o.php' -tr_str_str '?' '_questionmark_' \
               -norobots -dont_limit_inlines -dont_leave_dir \
               http://www.example.com/some_directory/ >OUT 2>ERR
于 2011-07-23T13:22:51.787 に答える