0

requests ライブラリを使用して、多数の URL をチェックしています。目的は、彼らがまだ生きているかどうかを確認することです。コードはとてもシンプルです

import requests

def checkurlalive(url):
    r = requests.head(url,timeout=10)
    if r.ok:
        return True
    else: 
        return False

ただし、次の URL では機能しません。

http://ieeexplore.ieee.org/ielx5/6294/4804034/04804053.pdftp=&arnumber=4804053&isnumber=4804034

この URL は PDF ファイルを表示するため、私のコンピューターでは機能しますが、上記の方法では requests.exceptions.Timeout エラーが発生します。

一方、次の URL:

http://www.wartsila.com/ss/Satellite?blobcol=urldata&blobheader=JPG&blobkey=id&blobtable=MungoBlobs&blobwhere=1278606917069&ssbinary=trueaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

有効な URL であってはなりませんが、上記の方法で肯定的な結果が得られます。

それはどうしてですか?

4

0 に答える 0