Facebook は、広告プラットフォームを介して人口統計に関するデータを提供しています。スクレイピングする方法 (Python を使用)?
1.) http://www.facebook.com/ads/create/にアクセスします。
2.) フォームに記入する
3.) 今、データがあります
サンプル画像を参照してください: http://www.webdistortion.com/wp-content/uploads/2010/10/fb4.jpg (私は新しいユーザーなので、画像を投稿できません)
問題:それをこする方法は?
私のアイデア:
1.) 機械化を使用 - フォームに入力することは可能かもしれませんが、推定数 (例では 112,960) がソース コードに表示されないため、解析できません => 他のトリックを行う必要がありますが、 ?
2.) セレン (または風車) を使用 - 私の記録は次のとおりです: facebook.com を開く --> 広告をクリックする --> 広告の作成をクリックする --> ...
残念ながら、これはすでに失敗しています。ログ:
[info] Executing: |open | / | |
[info] 実行中: |clickAndWait | link=広告 | | | [エラー] isNewPageLoaded が古い pageLoadError を検出しました: エラー: プロパティ Location.href を取得するための >> のアクセス許可が拒否されました [エラー] プロパティ Location.href を取得するためのアクセス許可が拒否されました [info] 実行中: |clickAndWait | clickAndWait | css=span.uiButtonText | | | [エラー] 予期しない例外: fileName -> chrome://selenium-ide/content/selenium-core/scripts/selenium-browserbot.js、lineNumber -> 840
このデータをスクレイピングできるという証拠があります: http://www.checkfacebook.com/
問題を解決することは、データ自体よりも興味深いものです (もちろん、このデータは確かに興味深いものです)。解決策があることは知っていますが、何も思いつきません。それは私を殺しています、助けてください。