17

wget ツールを使用して Web サイトのコンテンツをダウンロードしようとしています。-R オプションを使用して、一部のファイル タイプを拒否しました。しかし、ダウンロードしたくない他のファイルがいくつかあります。これらのファイルの名前は次のとおりで、拡張子はありません。

string-ID

例えば:

newsbrief-02

これらのファイル (名前が指定された文字列で始まるファイル) をダウンロードしないように wget に指示するにはどうすればよいですか?

4

2 に答える 2

40

(どうやら) v1.14wgetは正規表現 : --reject-regexandを受け入れるため--accept-regex(デフォルトでは、サポート付きでコンパイル--regex-type posixされた場合に設定できます)。pcrelibpcre

通話--reject-regexごとに1回しか使用できないように見えることに注意してください. wgetつまり、|複数の正規表現を選択する場合は、単一の正規表現で使用する必要があります。

wget --reject-regex 'expr1|expr2|…' http://example.com
于 2014-01-27T14:03:45.777 に答える
10

キーに正規表現を指定することはできませんwget -Rが、テンプレート(シェルのファイルテンプレートなど)を指定することはできます。

答えは次のようになります。

$ wget -R 'newsbrief-*' ...

?とシンボルクラスを使用することもできます[]

詳細については、infowgetを参照してください。

于 2012-06-27T17:28:34.077 に答える