1

Amazon.co.uk のページからコンテンツをスクレイピングするプロジェクトに取り組んでいます。ログイン フォームを正常に送信でき、Cookie を CookieContainer に保存すると、すべてが正常に表示され、サイトに正常にログインできます。ただし、特定のページを参照すると、ログアウトしているように見え、ログイン画面が再度表示されます。プログラムでページにアクセスすることはできません。

.NET 4 のサブドメインを持つ Cookie コンテナーに関連する、ここで報告されたバグに陥っている可能性があると思います: https://connect.microsoft.com/VisualStudio/feedback/details/771651/cookiecontainer-subdomain-handling-issue-in -net-4-0#

このリンクには 2 つの回避策があります。

回避策 #1: Version=1 の Cookie を含む応答を受け取った後、それらを >plain Cookie として新しい CookieContainer に追加し、この新しいコンテナーを使用して後続の要求を行います。

回避策 #2: 親ドメインの Version=1 Cookie を含む応答を受け取った後、それらを同じ >CookieContainer にもう一度追加します。今度はサブドメイン用です。

これを実装する方法を理解しているかどうかはわかりませんが、解決策を共有できる前にこれを経験した人はいますか? .NET 4.0 を実行しています。

ありがとう、コリン。

4

1 に答える 1