Beautiful Soup を使用してページをスクレイピングしようとしています。
このチュートリアルに従おうとしています。
株式ティッカー シンボルを送信した後、次のページのコンテンツを取得しようとしています。
http://www.cboe.com/delayedquote/quotetable.aspx
チュートリアルは「GET」メソッドのページ用で、私のページは「POST」です。それが問題の一部なのだろうか?
最初のテキスト ボックスを使用します。
「遅延相場については、下に株式または指数記号を入力してください。」</p>
関連コード:
user_agent = 'Mozilla/5 (Solaris 10) Gecko'
headers = { 'User-Agent' : user_agent }
values = {'ctl00$ctl00$AllContent$ContentMain$ucQuoteTableCtl$txtSymbol' : 'IBM' }
data = urllib.urlencode(values)
request = urllib2.Request("http://www.cboe.com/delayedquote/quotetable.aspx", data, headers)
response = urllib2.urlopen(request)
呼び出しは失敗しません。ページをインタラクティブに実行したときのように、一連のオプションと価格が返されません。私は文字化けしたHTMLの束です。
前もって感謝します!