問題タブ [urllib2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pythonurllib2を使用してファイルをダウンロードしています。ファイルサイズの大きさを確認するにはどうすればよいですか?
そして、それが大きい場合...それではダウンロードを停止しますか?12MBを超えるファイルをダウンロードしたくありません。
python - urlretrieve は空のファイルを返します
urlretrieve を使用して、次の形式の URL からファイルをダウンロードしようとしています。
http://example.com/download.php?id=6456&name=foo
それでも、何らかの理由で空の応答が返されます。
この質問で提案されている方法を試しましたが、役に立たなかったようです
キー「content-disposition」を含まず、
助言がありますか?
python - URLを介してjsonデータを取得し、Pythonで使用します(simplejson)
これには簡単な答えがあるはずですが、私は苦労しています。URL(jsonを出力する)を取得して、Pythonで使用可能な辞書のデータを取得したいと思います。私は最後のステップで立ち往生しています。
私が間違っているアイデアはありますか?
python - Pythonでいくつかのofxデータを取得します
http://www.jongsma.org/gc/scripts/ofx-ba.pyを使用して、ワコビアから銀行口座情報を取得しようとしていました。運が悪かったので、この例を使用してリクエストデータを手動で作成することにしました。
だから、私はリクエストデータとして使用したいこのファイルを持っています。それをreq.ofxsgmlと呼びましょう:
次に、Pythonで、次のことを試します。
このコマンドは私に500とこのトレースバックを与えます。私の要求の何が問題なのだろうか。
データもヘッダーも気にせずにURLにアクセスします。
そのURLに直接アクセスするのと同じ結果が得られます。
これは非常に明白ですが、単なる観察です。主題に関するすべてはかなり時代遅れのようです。オープンソースへの簡単なpythonofxモジュールを書きたいと思っています。たぶん、私が見つけることができなかった何かがすでに開発されていますか?
編集-上記の情報のフラットマッピングを作成する場合:
そしてそれをurlencodeし、それをデータとしてリクエストを行います
python - Python: 302 からの appengine urllib2 ヘッダー
通常は正常にurllib2機能します。
しかし、appengine では、同じコードでtext/html.
これを回避できますか?なぜこうなった?
python - urllib2 によって取得された gzip 圧縮されたデータを HTML に変換します
私は現在、以下のように gzip された Web ページを読むために mechanize を使用しています。
urllib2 によって取得された gzip 圧縮されたデータを HTML テキストに解凍する方法を教えてください。
python - URLLIB2 を使用したクライアント ダイジェスト認証 Python は認証ヘッダー情報を記憶しません
Python を使用して、ダイジェスト認証を使用するカスタム http サーバーに接続するクライアントを作成しようとしています。最初のリクエストを問題なく接続してプルできます。TCPDUMP を使用すると (私は MAC OS X を使用しています。私は MAC と Python の初心者です)、RFC2617 に精通している場合に予想されるように、最初の要求が実際には 2 つの http 要求であることがわかります。最初の結果は 401 UNAUTHORIZED です。サーバーから送り返されたヘッダー情報は、200 OK 応答とペイロードを生成するいくつかのカスタム Authorization ヘッダー値を持つ 2 番目の要求のヘッダーを生成するために正しく使用されます。
すべてが素晴らしいです。urllib2 のおかげで、私の HTTPDigestAuthHandler オープナーは機能しています。
同じプログラムで、同じサーバーから 2 番目の別のページを要求しようとしました。RFC によると、TCPDUMP は今回は 1 つの要求のみを表示し、ほぼすべて同じ認証ヘッダー情報を使用すると予想されます (nc はインクリメントする必要があります)。
代わりに、ゼロから始めて、最初に 401 を取得し、200 に必要な情報を再生成します。
urllib2 を使用して、ダイジェスト認証を使用した後続のリクエストで既知の認証ヘッダー値をリサイクルし、1 つのリクエストのみを実行することは可能ですか?
[意味がわかるまで数回読み直してください。これ以上分かりやすくする方法がわかりません]
Google は驚くほど成果を上げていないので、そうではないと思います。私は urllib2.py のコードとその非常に厄介なコード (「これはすばらしい努力ではありません」などのコメント) を見たので、これがバグであったとしてもショックを受けません。接続ヘッダーが閉じていることに気付きました。キープアライブに設定しても、上書きされます。それは私を keepalive.py に導きましたが、それも私にとってはうまくいきませんでした。
Pycurlも機能しません。
インタラクション全体を手作業でコーディングできますが、可能な場合は既存のライブラリに便乗したいと考えています。
要約すると、urllib2 とダイジェスト認証を使用して、同じサーバーから 2 つのページを取得し、3 つの http 要求のみを実行することは可能ですか (最初のページに 2 つ、2 つ目のページに 1 つ)。
以前にこれを試したことがあり、それが不可能であることをすでに知っている場合は、お知らせください。別の方法がある場合は、私はすべての耳です。
前もって感謝します。
python - urllib2にプロキシサーバーを設定しましたが、変更できません
タイトルが言うように、私のコードは基本的にこれを行います:
プロキシを設定し、プロキシをテストし、いくつかのクールなことをします
ただし、プロキシが最初に設定された後は、そのように固定され、変更されることはありません。これは失敗したコードです:
出力は次のようになります。
私は今本当に困惑しています。
御時間ありがとうございます。
PD:自宅のIPアドレスから応答するスクリプトは、$ _SERVER['REMOTE_ADDR']をエコーするPHPです。