Python Mechanize を使用して Web サイトを取得し、ローカル ディスクに保存しようとしています。問題は、多くの Web サイトが html/asp/php 以外のリンクにリダイレクトすることです。URL の拡張子と取得するファイルの種類を正確に検出する方法はありますか?
たとえば、 http ://www.yahoo.com は html ファイルとして保存する必要があります。
http://www.microsoft.com/en-us/download/confirmation.aspx?id=3745 は、リダイレクトしてから exe ファイルをダウンロードするため、.exe ファイルとして保存する必要があります。ただし、コンテンツタイプは text/html として宣言されているため、最も信頼できる方法ではないと思います。
ファイルを保存するときにブラウザが行うように、ファイル拡張子を正確に検出するにはどうすればよいですか?
ありがとうございます