BeautifulSoup で解析している XML ファイルがあります。私のファイルのごく一部は次のとおりです。
<document>
<ad>
<date>21-Apr-2013</date>
</ad>
<ad>
<date></date>
</ad>
</document>
date
空でない要素の数を数える最速の方法は何ですか? date
の属性に変換すると速くなりますad
か?
BeautifulSoup で解析している XML ファイルがあります。私のファイルのごく一部は次のとおりです。
<document>
<ad>
<date>21-Apr-2013</date>
</ad>
<ad>
<date></date>
</ad>
</document>
date
空でない要素の数を数える最速の方法は何ですか? date
の属性に変換すると速くなりますad
か?
<date>
これは空のタグをカウントします:
sum(1 for s in soup.find_all('date') if s.text)
しかし、本当にスピードを求めるなら、SAXなどの他のパーサーを検討してください。
属性を一致させるには、次を使用しますfind_all('ad', attrs={'date': ''})