3

BeautifulSoup で解析している XML ファイルがあります。私のファイルのごく一部は次のとおりです。

<document>
    <ad>
        <date>21-Apr-2013</date>
    </ad>
    <ad>
        <date></date>
    </ad>
</document>

date空でない要素の数を数える最速の方法は何ですか? dateの属性に変換すると速くなりますadか?

4

1 に答える 1

3

<date>これは空のタグをカウントします:

sum(1 for s in soup.find_all('date') if s.text)

しかし、本当にスピードを求めるなら、SAXなどの他のパーサーを検討してください。

属性を一致させるには、次を使用しますfind_all('ad', attrs={'date': ''})

于 2013-04-30T20:19:37.687 に答える