Python の urllib2 を使用して、Pandora の「いいね」トラックに関する情報を抽出しようとしています。次のコードから生成された HTML と、Chrome の inspect 要素を介して表示される HTML を比較すると、矛盾が生じます。
import urllib2
headers={ 'User-Agent' : 'Mozilla/5.0' }
url='http://www.pandora.com/profile/likes/myusername'
request=urllib2.Request(url,None,headers)
response = urllib2.urlopen(request)
html = response.read()
Chrome のシークレット モードを使用してログアウトした同じページを読み込めますが、これは認証の欠如が原因である可能性があると考えています。
そのため、次の行を追加して、リクエストで基本認証を使用しようとしました。
SERVER='pandora.com'
authinfo = urllib2.HTTPPasswordMgrWithDefaultRealm()
authinfo.add_password(None, SERVER, "login", "password")
handler=urllib2.HTTPBasicAuthHandler(authinfo)
myopener=urllib2.build_opener(handler)
opened=urllib2.install_opener(myopener)
headers={ 'User-Agent' : 'Mozilla/5.0' }
url='http://www.pandora.com/profile/likes/chris.r.armstrong'
request=urllib2.Request(url,None,headers)
response = urllib2.urlopen(request)
html = response.read()
まだ正しい HTML 応答が返されません。助言がありますか?