1

私はpython 2.7を使用しており、 requestsWebページを取得するために使用しています。

取得したオブジェクトが変更されたかどうかを知りたいです。

r = requests.get(url,headers=None,proxies=None,timeout=int(parms['timeout']))
html = r.text

if checksum(html)!=checksum_last: 
   then do something
else:
    do nothing

チェックサムをデータベースに保存します。チェックサムを作成するにはどうすればよいですか?

ありがとう

4

2 に答える 2

8

Jon Clements が言及しているように、hashlibモジュールを使用できます。

>>> import requests
>>> import hashlib
>>> page = requests.get('http://www.stackoverflow.com')
>>> hashlib.sha256(page.text.encode('utf-8')).hexdigest()
'807ea5e7c419aefc7a40ba1140ba6ef4001c60f3c21142eb743bc1d393c1bb62'
>>> 
于 2013-06-18T02:22:27.087 に答える
2

暗号化ハッシュ関数が必要ないと仮定すると、Adler-32またはCRC-32を使用できますzlib

r = requests.get(url,headers=None,proxies=None,timeout=int(parms['timeout']))
html = r.text
if zlib.adler32(html.encode("utf-8")) != checksum_last:
    print("New page!")
于 2013-06-18T02:23:54.083 に答える