wget を使用して wiki の静的ミラーをダウンロードしようとしています。各記事の最新バージョンのみが必要です (完全な履歴やバージョン間の差分ではありません)。全体をダウンロードして不要なページを後で削除するのは簡単ですが、そうすると時間がかかりすぎて、サーバーに不要な負担がかかります。
次のように、明らかに必要のないページがいくつかあります。
WhoIsDoingWhat?action=diff&date=1184177979
'action=diff' を含む URL をダウンロードして再帰しないように wget に指示する方法はありますか? または、正規表現に一致する URL を除外しますか?