次のアプリケーションを作成しようとしています。
Amazonセラーセントラルにログインします
内部に含まれるいくつかのページを開き、javascript によって入力された値を含む、レンダリングされたページ ソースを取得します。
レンダリングされたページ ソースを解析し、ユーザーのレポートを出力します。(この部分は完成です)
Firefox アドオンの firebug を使用してレンダリングされたページのソースを表示し、それをファイルにコピーすることで、このタスクを手動で完了することができ、パーサーの作成が完了しました。ただし、このプロセスを自動化し、技術にあまり詳しくない可能性のある個人と共有できるように、できるだけユーザーフレンドリーにしたいと考えています.
私の困難は、Python を使用してステップ 1 と 2 を完了することでした。ライブラリ urllib、urllib2、および cookielib の使用について多くの検索と読み取りを行ってきましたが、適切に機能させる方法を理解できませんでした。
たとえば、stackoverflow で次のスニペットを見つけました。
import urllib, urllib2, cookielib
username = "xxx"
password = "xxx"
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'username':username,'j_password':password})
opener.open('https://sellercentral.amazon.com/gp/homepage.html', login_data)
resp = opener.open('https://sellercentral.amazon.com/myi/search /ItemSummary.amzn?')
print resp.read()
これで、opener.open が間違っていることがわかりましたが、これを指す必要がある Amazon セラー セントラルのログイン スクリプトがどこにあるのかわかりません。
また、これについて正しい方法で行っているかどうかもわかりません。どんな方向でも大歓迎です。