HTTPS を使用してサイトからデータをスクレイピングしようとしています。Network.HTTP.Conduit を使用して基本的な要求を正常に行うことができました (資格情報の投稿など) が、応答ヘッダー (Set-Cookie) から Cookie 情報を抽出することに失敗しました。http-conduit にはCookie を処理するための独自のメカニズムがあるようですが、私には理解できませんでした。
Network.HTTP.Conduit.Browser は Cookie を自動的に処理するようですが (私には問題ありません)、ドキュメントが不足しているため機能しませんでした。
http-conduit ブラウザー モジュールを扱った経験のある人が、次の方法を教えてくれませんか?
- 自己署名証明書を処理します (基本モジュールのmanagerCheckCertsでこれを行うことができました)
- リダイレクトに従わず、本文に URL エンコードされたパラメーターを含む POST 要求を送信します (これにはベース モジュールのurlEncodedBodyを使用しました)。
- 2. ステップからの Cookie を単純な GET リクエストで使用し、応答を (遅延) ByteString として読み取ります (これにはhttpLbsを使用します) 。
Network.HTTP.Conduit.Browser の抽象化レベルは、Network.HTTP.Conduit と比較して私のアプリケーションにより適しているように見えるので、後者を使用して手動で Cookie を処理できたとしても切り替えたいと思います。