1

私はワイヤレス ISP が非常に不安定な地方に住んでいるので、コンテンツのストリーミング (特に何時間ものビデオ チュートリアル) は骨の折れる作業です。寝ている間にビデオを取得して、翌日レビューできるようにしたいと思っています。そのため、wget を使用して links.txt からファイルを取得してローカルに保存し、cron ジョブを使用してスケジュールを設定しようとしています。残念ながら、問題があります。

wget --save-cookies cookies.txt --post-data 'username=user&password=pwd' \ 
-erobots=off --secure-protocol=SSLv3 --no-check-certificate \
https://www.domain.com/login.aspx

wget --load-cookies cookies.txt --content-disposition 
--user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) \
Gecko/2008092416 Firefox/3.0.3" -l1 -H -t1 -nd -N -np -r -A.mp4 \
-erobots=off -w5 -i ../links.txt 

最初のコマンドは、Web サイトの Cookie 情報を正常に取得し、それぞれの cookies.txt に記録します。後者を使用すると、Web サイトに正常にログインして、コンテンツの取得を開始できました。ただし、これは page.html を取得するだけです (そして、予想どおり -r A.mp4 フラグのために破棄します)。RandomGeneratedFilename.mp4残念ながら、必要なコンテンツを取得するために、page.html の動的リンクを解決していません。私が見逃しているものはありますか?

page.html ファイルを取得した場合でも、リンクにファイル名/拡張子href="a/dynamic/path"がないため、.mp4 を保存できない理由は理にかなっています。しかし、wget を再帰的にその href に従って、適切なファイル名を決定して保存するにはどうすればよいでしょうか?

ありがたいことに、StackOverflow と Google は、ここまで渡すべき正しいフラグと、認証を成功させる方法を理解してくれましたが、最後のステップを理解することはできませんでした。これを行うには、bash スクリプトを作成し、awk とsedを組み合わせて使用​​する必要があると思いますが、正直なところよくわかりません...

現在、これを行うためにブラウザ プラグインを使用していますが、これは非常に手動のプロセスです。この時点で、ビデオをストリーミングしてウェブサイトで見るだけでよいかもしれませんが、前述のように、私の状況ではあまり実用的ではありません. :(

これは大きな恩恵になるので、皆さんが提供しなければならない時間と洞察をいつでも本当に感謝しています! 前もって感謝します。

4

0 に答える 0