1

次のアプリケーションを作成しようとしています。

  1. Amazonセラーセントラルにログインします

  2. 内部に含まれるいくつかのページを開き、javascript によって入力された値を含む、レンダリングされたページ ソースを取得します。

  3. レンダリングされたページ ソースを解析し、ユーザーのレポートを出力します。(この部分は完成です)

Firefox アドオンの firebug を使用してレンダリングされたページのソースを表示し、それをファイルにコピーすることで、このタスクを手動で完了することができ、パーサーの作成が完了しました。ただし、このプロセスを自動化し、技術にあまり詳しくない可能性のある個人と共有できるように、できるだけユーザーフレンドリーにしたいと考えています.

私の困難は、Python を使用してステップ 1 と 2 を完了することでした。ライブラリ urllib、urllib2、および cookielib の使用について多くの検索と読み取りを行ってきましたが、適切に機能させる方法を理解できませんでした。

たとえば、stackoverflow で次のスニペットを見つけました。

import urllib, urllib2, cookielib

username = "xxx"
password = "xxx"

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'username':username,'j_password':password})
opener.open('https://sellercentral.amazon.com/gp/homepage.html', login_data)
resp = opener.open('https://sellercentral.amazon.com/myi/search      /ItemSummary.amzn?')
print resp.read()

これで、opener.open が間違っていることがわかりましたが、これを指す必要がある Amazon セラー セントラルのログイン スクリプトがどこにあるのかわかりません。

また、これについて正しい方法で行っているかどうかもわかりません。どんな方向でも大歓迎です。

4

2 に答える 2

0

これを見てください

http://seleniumhq.org/

またはこれ

http://wwwsearch.sourceforge.net/mechanize/j

ブラウザ環境では、やりたいことが少し簡単になるかもしれません。

br.select_form(name="order")
# Browser passes through unknown attributes (including methods)
# to the selected HTMLForm.
br["cheeses"] = ["mozzarella", "caerphilly"]  # (the method here is __setitem__)
# Submit current form.  Browser calls .close() on the current response on
# navigation, so this closes response1
response2 = br.submit()
于 2012-10-02T22:23:03.313 に答える
0

別の方法として、 AmazonマーケットプレイスのWebサービスを参照してください。Pythonライブラリはないようですが、他の言語のクライアントがあります。

于 2012-10-09T21:06:18.840 に答える