div からすべてのテキストを取得しようとしていますが、一部のタグで一部のテキストを除外したいと考えています。のすべてのテキストと同様<header><h2>some text</h2><header>
に、 a のテキストも除外する場合があります<footer>
。
私はすでに次のようなものを持っています:
tree = <some html>
XpathArticleSummary = "string(div)"
divs = tree.xpath(XpathArticleSummary)
私が欲しいのは次のようなものです:
XpathArticleSummary = "string(div[not(header|footer)])"
しかし、これはもちろん機能しません:)
除外する方法はありますか?