こんにちは、FacebookページのURLのリストがあります
eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...
最善の方法は次のとおりです。
これらの URL が実際に Facebook ページ用であり、プロフィール用ではないかどうかを確認してください
これらのページからファンの数などの詳細を収集します
助けていただければ幸いです。
こんにちは、FacebookページのURLのリストがあります
eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...
最善の方法は次のとおりです。
これらの URL が実際に Facebook ページ用であり、プロフィール用ではないかどうかを確認してください
これらのページからファンの数などの詳細を収集します
助けていただければ幸いです。
コンテンツをスクレイピングせずに(とにかくFacebookの利用規約に違反します):
select
fan_count from
page where
username='michaeljackson'
同じ呼び出しで取得できる他のデータについては、ページFQLテーブルを参照してください。
urllib2またはpyfacebookを使用してコンテンツを取得します
BeautifulSoupまたはlxmlを使用して解析します
reモジュール (正規表現) を使用して、検証とデータ収集用のコンテンツを抽出します。
ファンの数は、クラス「FanManager」のタグにあります。Beautiful Soup を使用してこのタグのコンテンツを取得し、正規表現を使用して文字列 (例: 1,000,000 ファン) からデータを int または任意のものとして取得できます。
ページが存在するかどうかを確認するには、いくつかのタグをチェックして、404 ページにいるかどうかを確認します。
コンテンツをスクレイピングするには、 scrapyまたはBeautifulSoupを使用できます。