python - urllib.urlopen は古いページを返しますか?

Question

だから私は非常に単純な HTML ページ (dir リスト) を持っていて、このように urllib でそれを読み込もうとします:

page =  urllib.urlopen(coreRepositoryUrl).read()

問題は、この方法で読み取った HTML が最新のものよりも古いことです。info()これを返します：

Date: Fri, 19 Apr 2013 18:48:09 GMT
Server: Apache/2.0.52 (Fedora)
Content-Type: text/html; charset=UTF-8
Connection: close
Age: 481084

そして、このページの最終更新は本日 (2013-04-25) です。キャッシュする可能性のあるコンポーネントはどれですか?

score 3 · Accepted Answer

リクエストに値「max-age=0」のヘッダー「Cache-Control」を追加します

import urllib2
req = urllib2.Request(url)
req.add_header('Cache-Control', 'max-age=0')
resp = urllib2.urlopen(req)
content = resp.read()

そのヘッダーを使用すると、途中で各キャッシュがキャッシュエントリを再検証します

1 に答える 1