urllib を使用して html ページを取得し、BeautifulSoup を使用して html ページを解析できますが、BeautifulSoup から読み取るファイルを生成する必要があるようです。
import urllib
sock = urllib.urlopen("http://SOMEWHERE")
htmlSource = sock.read()
sock.close()
--> write to file
urllib からファイルを生成せずに BeautifulSoup を呼び出す方法はありますか?