1

ログイン後、自分の投稿のために Facebook をスクレイピングする必要がありますが、「接続を維持する」方法がわかりません。

私は urllib を使用しています。サーバーに接続し、ページを取得し、データを送信する方法は知っていますが、ログインが必要なページにアクセスするために Cookie を処理する方法がわかりません。仕事をするためにcookielibが必要であることがわかりましたが、仕事を成し遂げる方法を説明するチュートリアルや何かが見つかりません。

何らかの方法で私を助けてくれませんか?またはチュートリアルへのリンクを教えてください。

4

3 に答える 3

3

Facebookページをスクレイピングしないでください。利用規約に違反します。代わりに、投稿を取得できるアプリケーションを登録できるGraph APIを使用してください。

于 2013-02-15T15:52:18.813 に答える
2

これを行うには、アプリケーションでCookieJarを維持する必要があります。このライブラリは、スクレイピング セッション全体で Cookie (取得したいログイン トークンなど) を永続化できる Python HTTP クライアントのプラグインのようなものです。

Facebook がリクエストを受け入れるには、有効なユーザー エージェントを指定する必要がある場合があることに注意してください。

于 2013-02-15T16:58:56.440 に答える
1

Facebookライブラリに既存のPythonを使用してみませんか?APIに接続して、ステータスメッセージを投稿/取得するだけの場合は、それほど複雑であるとは思えません。

于 2013-02-15T16:24:57.833 に答える