5

wget を使用して wiki の静的ミラーをダウンロードしようとしています。各記事の最新バージョンのみが必要です (完全な履歴やバージョン間の差分ではありません)。全体をダウンロードして不要なページを後で削除するのは簡単ですが、そうすると時間がかかりすぎて、サーバーに不要な負担がかかります。

次のように、明らかに必要のないページがいくつかあります。

WhoIsDoingWhat?action=diff&date=1184177979

'action=diff' を含む URL をダウンロードして再帰しないように wget に指示する方法はありますか? または、正規表現に一致する URL を除外しますか?

4

1 に答える 1

3
-R '*action=diff*,*action=edit*'
于 2009-06-01T17:55:10.303 に答える