wget ツールを使用して Web サイトのコンテンツをダウンロードしようとしています。-R オプションを使用して、一部のファイル タイプを拒否しました。しかし、ダウンロードしたくない他のファイルがいくつかあります。これらのファイルの名前は次のとおりで、拡張子はありません。
string-ID
例えば:
newsbrief-02
これらのファイル (名前が指定された文字列で始まるファイル) をダウンロードしないように wget に指示するにはどうすればよいですか?
(どうやら) v1.14wgetは正規表現 : --reject-regexandを受け入れるため--accept-regex(デフォルトでは、サポート付きでコンパイル--regex-type posixされた場合に設定できます)。pcrelibpcre
通話--reject-regexごとに1回しか使用できないように見えることに注意してください. wgetつまり、|複数の正規表現を選択する場合は、単一の正規表現で使用する必要があります。
wget --reject-regex 'expr1|expr2|…' http://example.com
キーに正規表現を指定することはできませんwget -Rが、テンプレート(シェルのファイルテンプレートなど)を指定することはできます。
答えは次のようになります。
$ wget -R 'newsbrief-*' ...
?とシンボルクラスを使用することもできます[]。
詳細については、infowgetを参照してください。