ファイルのみを含めたかったので.jpg
、.png
ファイルを無視するにはどうすればよいですか。wget
.html
やっています:
wget -R index.html,*tiff,*pdf,*jpg -m http://example.com/
しかし、それは機能していません。
ファイルのみを含めたかったので.jpg
、.png
ファイルを無視するにはどうすればよいですか。wget
.html
やっています:
wget -R index.html,*tiff,*pdf,*jpg -m http://example.com/
しかし、それは機能していません。
使用
--reject jpg,png --accept html
特定の拡張子を持つファイルを除外/含めるオプションについては、http://www.gnu.org/software/wget/manual/wget.html#Recursive-Accept_002fReject-Optionsを参照してください。
ワイルドカード文字を使用してパターンを引用符で囲みます。そうしないと、シェルがそれらを展開します。http://www.gnu.org/software/wget/manual/wget.html#Types-of-Filesを参照してください。
アーカイブを除くすべてのファイルをダウンロードする実際の例:
wget -r -k -l 7 -E -nc \
-R "*.gz, *.tar, *.tgz, *.zip, *.pdf, *.tif, *.bz, *.bz2, *.rar, *.7z" \
-erobots=off \
--user-agent="Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36" \
http://misis.ru/