1

すべてのChromeブックマークをダウンロードするためのスクリプトがあります。一部のブックマークは.phpで終わり、-html-extensionオプションを使用しないと、Webブラウザーで開くことができないため、wgetを--html-extensionとともに使用します。私が抱えている問題は、-html-extensionを--no-clobberと一緒に使用すると、何らかの理由でほとんどのファイルがすでに存在していることを認識しないため、ファイルを再ダウンロードするプロセス全体を実行することです。すでに持っています。

例:wget -nc http://www.test.com/ を1回実行すると、想定どおりにファイルが保存されます。もう一度実行すると、ファイルはすでにそこにあると表示されるので、取得しません。それは私が期待する操作です。

ただし、保存したばかりのファイルを削除して実行します:wget -nc http://www.test.com/ --html-extensionその後、同じコマンドを再度実行します。すでにそこにあるファイルを言う代わりに、ファイルを上書きします。何が起こっている?

4

1 に答える 1

2

htmlサフィックスが追加されると、wgetはそれを比較したいリモートファイルを判断できません。

man wget: http: //unixhelp.ed.ac.uk/CGI/man-cgi ?wget

======================

--html-拡張子

タイプapplication/xhtml+xmlまたはtext/htmlのファイルがダウンロードされ、URLがregexp。[Hh] [Tt] [Mm] [Ll]?で終わっていない場合、このオプションにより、サフィックス.htmlは次のようになります。ローカルファイル名に追加されます。これは、たとえば、.aspページを使用するリモートサイトをミラーリングしているが、ミラーリングされたページをストックApacheサーバーで表示できるようにする場合に便利です。これのもう1つの良い使用法は、CGIで生成された資料をダウンロードする場合です。http://site.com/article.cgi?25のようなURLは、article.cgi?25.htmlとして保存されます。

この方法で変更されたファイル名は、サイトを再ミラーリングするたびに再ダウンロードされることに注意してください。これは、ローカルX.htmlファイルがリモートURL Xに対応していることをWgetが認識できないためです(URLがまだわからないため)。タイプtext/htmlまたはapplication/xhtml + xmlの出力を生成します。 この再ダウンロードを防ぐには、ファイルの元のバージョンがX.origとして保存されるように、-kおよび-Kを使用する必要があります。

于 2013-01-23T02:48:12.377 に答える