最近、サインイン アカウントに基づいて、stackoverflow.comcurl
から推奨される質問リストをクロールするために使用しています。
現在、アカウント情報を HTTP リクエストに登録するために、ヘッダーと Cookie (ブラウザーに表示される) をファイルにコピー アンド ペーストしcurl
、データをクロールするスクリプトを作成しました。
ただし、気づいたように、ブラウザから送信されるやCookie
などのフィールドのいくつかのキーは定期的に変更されるため、それに応じてスクリプトの Cookie 値を更新する必要があります。そうしないと、自分の口座情報。__utma
__utmb
私の側で必要なこの更新は、実際には非常に面倒です。
私の混乱は次のとおりです。1、Cookie フィールド (ブラウザから送信される) が定期的に変更されるのはなぜですか? その背後にある理由は何ですか?2. CURL をブラウザのように動作させて、ブラウザと同じ方法で Cookie を適応させる方法はありますか?