だから私は非常に単純な HTML ページ (dir リスト) を持っていて、このように urllib でそれを読み込もうとします:
page = urllib.urlopen(coreRepositoryUrl).read()
問題は、この方法で読み取った HTML が最新のものよりも古いことです。info()
これを返します:
Date: Fri, 19 Apr 2013 18:48:09 GMT
Server: Apache/2.0.52 (Fedora)
Content-Type: text/html; charset=UTF-8
Connection: close
Age: 481084
そして、このページの最終更新は本日 (2013-04-25) です。キャッシュする可能性のあるコンポーネントはどれですか?