1

lxml/xpath を使用して特定の img 要素を見つけ、短い php スクリプトをそれらの src 属性に書きたいと思います。そのようです:

from lxml import html

htmldoc = html.document_fromstring(htmlstr)
imgs = htmldoc.xpath("//*[@class='someclass']/img")
imgs[0].attrib['src'] = "<?php echo get_img_file(); ?>"
processedHTML = html.tostring(htmldoc, pretty_print=True)

with open("test.php","w+") as outfile:
    outfile.write(processedHTML.decode("utf-8"))

不正な文字 (< や > など) は、html エンティティとしてエスケープされます。これらの文字をドキュメントに書き込むことができるように lxml を設定する方法はありますか? ありがとう!

4

0 に答える 0