私はlxmlとpythonを使用してページをスクレイプしています。このページへのリンクはこちらです。私が今直面している問題は、タグ内の属性を取得する方法です。たとえば、ページの上部にある3つのゴールドスターには、htmlがあります。
<abbr title="3" class="average rating large star3">★★★☆☆</abbr>
ここでタイトルを取得して、この場所で星がいくつ取得されたかを確認します。
私はこれを含むいくつかのことをやってみました:
response = urllib.urlopen('http://www.insiderpages.com/b/3721895833/central-kia-of-irving-irving').read()
mo = re.search(r'<div class="rating_box">.*?</div>', response)
div = html.fromstring(mo.group(0))
title = div.find("abbr").attrib["title"]
print title
しかし、私にはうまくいきません。助けていただければ幸いです。