0

デューク ライブラリ Web プロキシを使用してアクセスできるデータベースのスクレイピングに取り組んでいます。データベースはプロキシ サーバー経由でアクセスされるため、データベースがプロキシ認証を必要としない場合のように、このデータベースを直接スクレイピングできないという問題が発生しました。

私はいくつかのことを試しました:

duke ネットワークにログインするスクリプトを 1 つ作成しました (https://shib.oit.duke.edu/idp/AuthnEngine')。

次に、ログイン データをハードコーディングします。

login_data = urllib.urlencode({'j_username' : 'userxx',
                           'j_password' : 'passwordxx',
                           'Submit' : 'Enter'
                           })

次にログインします。

resp = opener.open('https://shib.oit.duke.edu/idp/AuthnEngine', login_data)

次に、プロキシ Web サイトからの Cookie を保持する Cookie jar オブジェクトを作成します。

次に、スクリプトを使用してデータベースにアクセスしようとしましたが、それでも認証が必要であると表示されます。プロキシ サーバーに必要な認証を回避する方法を知りたかったのです。

何か提案があれば教えてください。

ありがとう、ジャン

4

1 に答える 1

0

プロキシ ログインは Cookie を保存せず、代わりにProxy-Authorizationヘッダーを使用します。このヘッダーは、のようなすべてのリクエストで送信する必要がありますCookies。ヘッダーは、通常の基本認証と同じ形式ですが、異なる形式が可能です ( Digest、 .) 通常のログインのヘッダーを確認し、送信されNTLMたヘッダーをコピーして貼り付けることをお勧めします。Proxy-Authorization

于 2012-08-01T17:18:56.000 に答える