requests ライブラリを使用して、多数の URL をチェックしています。目的は、彼らがまだ生きているかどうかを確認することです。コードはとてもシンプルです
import requests
def checkurlalive(url):
r = requests.head(url,timeout=10)
if r.ok:
return True
else:
return False
ただし、次の URL では機能しません。
http://ieeexplore.ieee.org/ielx5/6294/4804034/04804053.pdftp=&arnumber=4804053&isnumber=4804034
この URL は PDF ファイルを表示するため、私のコンピューターでは機能しますが、上記の方法では requests.exceptions.Timeout エラーが発生します。
一方、次の URL:
http://www.wartsila.com/ss/Satellite?blobcol=urldata&blobheader=JPG&blobkey=id&blobtable=MungoBlobs&blobwhere=1278606917069&ssbinary=trueaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
有効な URL であってはなりませんが、上記の方法で肯定的な結果が得られます。
それはどうしてですか?