13

urllib2 で簡単な POST リクエストを実行しようとしています。ただし、サーバーの応答は、単純な GET を受信したことを示しています。送信リクエストのタイプを確認しましたが、POST に設定されています。
サーバーが期待どおりに動作するかどうかを確認するために、URL に連結された (以前の POST-) データを使用して GET 要求を実行しようとしました。これは私が期待した答えを得ました。
私が誤解したことを誰かが手がかりを持っていますか?

def connect(self):
    url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    header = { 'User-Agent' : user_agent }

    values = {
      'city_from' : 69,
      'radius_from' : 0,
      'city_to' : 263,
      'radius_to' : 0,
      'date' : 'date',
      'day' : 5,
      'month' : 03,
      'year' : 2012,
      'tolerance' : 0
    }

    data = urllib.urlencode(values)
    # req = urllib2.Request(url+data, None, header) # GET works fine
    req = urllib2.Request(url, data, header)  # POST request doesn't not work

    self.response = urllib2.urlopen(req)

これは、 Python URLLib / URLLib2 POSTで説明されているような問題のようですが、私の場合、末尾のスラッシュが欠落していないことは確かです。;)

これはばかげた誤解かもしれませんが、私はすでに何時間も疑問に思っています!



EDIT:印刷のための便利な機能:

def response_to_str(response):
    return response.read()

def dump_response_to_file(response):
    f = open('dump.html','w')
    f.write(response_to_str(response))



編集 2: 解決策:

サイトとの実際のやり取りをキャプチャするツールを見つけましたhttp://fiddler2.com/fiddler2/。どうやら、サーバーは入力フォームからデータを取得し、数回リダイレクトしてから、このデータを単純に URL に追加して GET リクエストを作成します。
urllib2 ではすべて問題ありません。時間を無駄にしてしまったことをお詫びします。

4

4 に答える 4

15

確認する必要がある事項:

  • 正しい URL に投稿していますか?
  • ログインせずに結果を取得できますか?
  • さまざまな post 値の出力例をいくつか示します。

Firefox のFirebugまたは Google Chromes DevToolsを使用して、正しい投稿 URL を見つけることができます。

Cookie をサポートするコードをいくつか提供したので、最初にログインし、Cookie を使用して投稿パラメータで後続のリクエストを行うことができます。

最後に、HTML 出力の例をいくつか示していただければ、作業が楽になります。

これは、 CSRF/XSRFで保護されたページを含むほとんどのWebページへのPOST-ingで、これまでのところ非常に確実に機能している私のコードです(投稿するものと投稿する場所(URL)を正しく把握できる限り) )。

import cookielib
import socket
import urllib
import urllib2

url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'
http_header = {
                "User-Agent" : "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.46 Safari/535.11",
                "Accept" : "text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,text/png,*/*;q=0.5",
                "Accept-Language" : "en-us,en;q=0.5",
                "Accept-Charset" : "ISO-8859-1",
                "Content-type": "application/x-www-form-urlencoded",
                "Host" : "www.mitfahrgelegenheit.de",
                "Referer" : "http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/"
                }

params = {
  'city_from' : 169,
  'radius_from' : 0,
  'city_to' : 263,
  'radius_to' : 0,
  'date' : 'date',
  'day' : 5,
  'month' : 03,
  'year' : 2012,
  'tolerance' : 0
}

# setup socket connection timeout
timeout = 15
socket.setdefaulttimeout(timeout)

# setup cookie handler
cookie_jar = cookielib.LWPCookieJar()
cookie = urllib2.HTTPCookieProcessor(cookie_jar)

# setup proxy handler, in case some-day you need to use a proxy server
proxy = {} # example: {"http" : "www.blah.com:8080"}

# create an urllib2 opener()
#opener = urllib2.build_opener(proxy, cookie) # with proxy
opener = urllib2.build_opener(cookie) # we are not going to use proxy now

# create your HTTP request
req = urllib2.Request(url, urllib.urlencode(params), http_header)

# submit your request
res = opener.open(req)
html = res.read()

# save retrieved HTML to file
open("tmp.html", "w").write(html)
print html
于 2012-03-04T01:25:40.133 に答える
1

質問を締めくくるだけです
。実際の問題は、サーバーが POST 要求を予期していなかったことです (ただし、ユースケースを考慮する必要があります)。したがって、(もう一度) フレームワークは壊れていません。;)

于 2012-04-08T20:04:55.980 に答える
0

ヘッダーにペアを追加してみてください。

   'Content-type': 'application/x-www-form-urlencoded'
于 2012-03-02T23:21:02.497 に答える
0

次のように、URLから末尾のスラッシュを削除してみてください。

url = 'http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html'

リクエスト先のサーバースクリプトがPOST実際にはPOSTリクエストをサポートしていない場合があります。

于 2012-03-02T23:35:31.487 に答える