Python の HTMLParser と BeautifulSoup を使用して、Yahoo の財務データを解析しています。これを行うために書かれた非常に優れたパッケージが既にありますが、「具体的な価格/帳簿価額」を取得しません。つまり、帳簿価額の計算にのれんやその他の無形資産が含まれています。したがって、私は自分のソリューションを展開することを余儀なくされています。
それはきれいではありませんでした。これがコードです
from BeautifulSoup import BeautifulSoup
import urllib2
from HTMLParser import HTMLParse
class data(HTMLParser):
def handle_data(self, data):
print data
parser = data()
url='http://finance.yahoo.com/q/bs?s=BAC&annual'
response = urllib2.urlopen(url)
html = response.read()
soup=BeautifulSoup(html)
tangibles=[str(parser.feed(str(soup('strong')[24:26])))]
これには 2 つの問題があります。1) データが常に Yahoo のページの同じ場所にあることに頼っています。これは最大の問題ではありませんが、私を満足させるものではありません。2) 本当の問題です。
tangibles=[str(parser.feed(str(soup('strong')[24:26])))]
「データ」クラスは必要なものを印刷しているだけで、保存していないため、空のリストです。
パート 2) についてお答えいただければ幸いです。授業はまだわかりません。