python - BeautifulSoup4 で xml タグの名前空間を指定するにはどうすればよいですか?

Question

私はこのようなbeautifulsoup4を使用しています：

from bs4 import BeautifulSoup
xml_string = u"""<something><dcterms:valid><![CDATA[

            start=2012-02-24T00:00:00Z
            end=2030-12-30T00:00:00Z
            scheme=W3C-DTF]]>
        </dcterms:valid></something>"""
soup = BeautifulSoup(xml_string, 'xml')
soup.find('dcterms:valid')  # returns None
soup.find('valid')  # returns the dcterms:valid node

で名前空間を指定して、soup.find(tagname)探しているものを正確に特定する方法はありますか?

score 1 · Accepted Answer

解析中に「xml」を指定する必要はありません（編集：コメントで指摘されているようにcdataがない限り）。

これが私のために働いたサンプルコードです

>>> soup = BeautifulSoup(xml_string)
>>> soup.find('valid')
>>> soup.find('dcterms:valid')
<dcterms:valid start="2012-02-24T00:00:00Z" end="2030-12-30T00:00:00Z" scheme="W3C-DTF"></dcterms:valid>

>>> item = soup.find('dcterms:valid')
>>> item['start']
u'2012-02-24T00:00:00Z'

python - BeautifulSoup4 で xml タグの名前空間を指定するにはどうすればよいですか?

1 に答える 1

Related

Reference