0

サイトをダウンロードしてミラーリングする wget スクリプトを作成しています。URL はテキスト ファイルから取得されます。スクリプト全体をほぼ作成しましたが、今は完璧にする必要があります。毎日 3 時間使用するため、最後に終了した場所から継続する必要があります。
以下にスクリプトを提供します。誰かが役に立つと思う場合は、それを使用できますが、スクリプトに私の名前を残してください。

スクリプトの問題:

スクリプトは、親ディレクトリ内のファイルを参照可能にすることで、リンクを正しく参照していません。それについて教えてください。--continueパラメータを使用
しても、スクリプトが途中で中止された後に再開されない

#       Created by Salik Sadruddin Merani
#       email: ssm14293@gmail.com
#       site: http://www.dragotech-innovations.tk
clear
echo '  Created by: Salik Sadruddin Merani'
echo '  email: ssm14293@gmail.com'
echo '  site: http://www.dragotech-innovations.tk'
echo
echo '  Info:'
echo '  This script will use the URLs provided in the File "urls.txt"'
echo '  Info: Logs will be saved in logfile.txt'
echo '  URLs are taken from the urls.txt file'
#
url=`< ./urls.txt`
useragent='Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0'
echo '  Mozilla Firefox User agent will be used'

cred='log=abc@123.org&pwd=abc123&wp-submit=Log In&redirect_to=http://abc@123.org/wp-admin/&testcookie=1'
echo '  Loaded Credentails'
echo '  Logging In'
wget --save-cookies cookies.txt --post-data ${cred} --keep-session-cookies http://members.ebenpagan.com/wp-login.php --delete-after

OIFS=$IFS
IFS=','
arr2=$url
for x in $arr2
do
    echo '      Loading Cookies'
    wget --spider --load-cookies cookies.txt --keep-session-cookies --mirror --convert-links --page-requisites ${x} -U ${useragent} -np --adjust-extension --continue -e robots=no --span-hosts --no-parent -o log-file-$x.txt
done
IFS=$OIFS

よろしく

4

1 に答える 1