5

そのため、wgetを使用してWebサイト/ディレクトリからすべての特定の拡張機能をダウンロードするためのエイリアス/スクリプトを作成しようとしていますが、私が思いついたよりも簡単な方法が必要だと感じています.

現在、Google と man ページを検索して思いついたコードは次のとおりです。

wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/

上記の例では、事前に作成された OpenVZ テンプレート ディレクトリからすべての .tar.gz ファイルをダウンロードしようとしています。

上記のコードは正しく動作しますが、手動で --cut-dirs=2 を指定する必要があります。これにより、通常は作成される /template/precreated/ ディレクトリ構造が切り取られ、robots.txt ファイルもダウンロードされます。

これは必ずしも問題ではなく、robots.txt ファイルを削除するのは簡単ですが、切り出すディレクトリ構造を指定せずにこれと同じことを実行できるマニュアル ページの何かを見落としていることを望んでいました.. .

事前に助けてくれてありがとう、それは大歓迎です!

4

2 に答える 2

7

-Rオプションを使用する

-R robots.txt,unwanted-file.txt

不要なファイルの拒否リスト (カンマ区切り) として。

これをスクリプト化する場合:

URL=http://download.openvz.org/template/precreated/
CUTS=`echo ${URL#http://} | awk -F '/' '{print NF -2}'`
wget -r -l1 -nH --cut-dirs=${CUTS} --no-parent -A.tar.gz --no-directories -R robots.txt ${URL}

これは、URL のサブディレクトリに基づいて機能するはずです。

于 2013-01-23T22:00:44.903 に答える
2

これが本当に面倒で、何度もやらなければならない場合は、非常に短い 2 行のスクリプトを記述して削除することをお勧めします。

wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/
rm robots.txt
于 2013-01-23T21:47:31.367 に答える