2

ポーカー プラットフォームの Web ページから情報をスクレイピングしたいと考えています。

そのためには、https Web ページ「www.name.com」にログイン (投稿) する必要があります。しかし、情報はサブドメイン「poker.name.com」に置かれています。ログインはかなりうまくいきますが、サブドメイン libcurl からサイトを取得すると、新しい Cookie を使用して新しい接続 obv がセットアップされます。次に、ログインする必要があることを思い出させるページが表示されます。

ここで私の質問は、libcurl に同じ接続または少なくとも同じ Cookie を使用させてサブドメインからページを取得させる方法です。

編集:私の質問に対する解決策ではありませんが、うまくいきます:サブドメインにログインしたところです。そこにもログイン スクリプトが存在します。

4

1 に答える 1

4

libcurl ハンドルの Cookie を有効にすると、後続のリクエストでそのハンドルを再利用するだけで、libcurl は自動的に Cookie を使用します。

ハンドルを閉じて新しいハンドルを作成することを主張する場合、CURLOPT_COOKIEJARは、Cookie をファイルに保存するオプションであり、CURLOPT_COOKIEFILEはその後、そのようなファイルからそれらを再度読み取ることができます。別の方法として、libcurl の共有インターフェイスを使用して、複数のハンドルで Cookie を共有することもできます。

次に、このようなサイトでブラウザを「適切に」模倣するために、手動セッション中に送受信された HTTP ヘッダーを記録して、プログラムがブラウザと同じ URL とデータを使用していることを確認できるようにする必要があります。

于 2012-09-26T21:03:48.270 に答える