以下のウェブサイトのページで、Beautiful Soup を使用して Facebook のコメントをスクレイピングしようとしています。
import BeautifulSoup
import urllib2
import re
url = 'http://techcrunch.com/2012/05/15/facebook-lightbox/'
fd = urllib2.urlopen(url)
soup = BeautifulSoup.BeautifulSoup(fd)
fb_comment = soup("div", {"class":"postText"}).find(text=True)
print fb_comment
出力はヌル セットです。ただし、Facebook のコメントが、techcrunch サイトの inspect 要素の上記のタグ内にあることがはっきりとわかります (私は Python を初めて使用するので、このアプローチが正しいのか、どこが間違っているのか疑問に思っていました)。