lxml を使用して、次のようにフォーマットされたコメントの配列を取得しようとしています
<div id="comment-1">
TEXT
</div>
<div id="comment-2">
TEXT
</div>
<div id="comment-3">
TEXT
</div>
...
使ってみた
html.findall(".//div[@id='comment-*']")
しかし、これは文字通りのアスタリスクを検索します。
私がやろうとしていることの正しい構文は何ですか?
編集:私は最終的にそれを動作させました
doc = lxml.html.parse(url).getroot()
comment_array = doc.xpath('.//div[starts-with(@id, "comment-")]')