デューク ライブラリ Web プロキシを使用してアクセスできるデータベースのスクレイピングに取り組んでいます。データベースはプロキシ サーバー経由でアクセスされるため、データベースがプロキシ認証を必要としない場合のように、このデータベースを直接スクレイピングできないという問題が発生しました。
私はいくつかのことを試しました:
duke ネットワークにログインするスクリプトを 1 つ作成しました (https://shib.oit.duke.edu/idp/AuthnEngine')。
次に、ログイン データをハードコーディングします。
login_data = urllib.urlencode({'j_username' : 'userxx',
'j_password' : 'passwordxx',
'Submit' : 'Enter'
})
次にログインします。
resp = opener.open('https://shib.oit.duke.edu/idp/AuthnEngine', login_data)
次に、プロキシ Web サイトからの Cookie を保持する Cookie jar オブジェクトを作成します。
次に、スクリプトを使用してデータベースにアクセスしようとしましたが、それでも認証が必要であると表示されます。プロキシ サーバーに必要な認証を回避する方法を知りたかったのです。
何か提案があれば教えてください。
ありがとう、ジャン