wget ツールを使用して Web サイトのコンテンツをダウンロードしようとしています。-R オプションを使用して、一部のファイル タイプを拒否しました。しかし、ダウンロードしたくない他のファイルがいくつかあります。これらのファイルの名前は次のとおりで、拡張子はありません。
string-ID
例えば:
newsbrief-02
これらのファイル (名前が指定された文字列で始まるファイル) をダウンロードしないように wget に指示するにはどうすればよいですか?
(どうやら) v1.14wget
は正規表現 : --reject-regex
andを受け入れるため--accept-regex
(デフォルトでは、サポート付きでコンパイル--regex-type posix
された場合に設定できます)。pcre
libpcre
通話--reject-regex
ごとに1回しか使用できないように見えることに注意してください. wget
つまり、|
複数の正規表現を選択する場合は、単一の正規表現で使用する必要があります。
wget --reject-regex 'expr1|expr2|…' http://example.com
キーに正規表現を指定することはできませんwget -R
が、テンプレート(シェルのファイルテンプレートなど)を指定することはできます。
答えは次のようになります。
$ wget -R 'newsbrief-*' ...
?
とシンボルクラスを使用することもできます[]
。
詳細については、infowgetを参照してください。