6

BeautifulSoupを使用してタグの値を取得する方法を誰かに指示してもらえますか?ドキュメントを読みましたが、ナビゲートするのに苦労しました。たとえば、私が持っていた場合:

<span title="Funstuff" class="thisClass">Fun Text</span>

BeautifulSoup / Pythonをバスに乗せて「Funstuff」をプルするにはどうすればよいですか?

編集:バージョン3.2.1を使用しています

4

2 に答える 2

7

あなたはあなたが探している要素を識別するために何かを持っている必要があります、そしてそれがこの質問で何であるかを言うのは難しいです。

たとえば、これらは両方とも、BeautifulSoup 3で「Funstuff」を出力します。1つはspan要素を探してタイトルを取得し、もう1つは指定されたクラスのspanを探します。この点に到達するための他の多くの有効な方法が可能です。

import BeautifulSoup
soup = BeautifulSoup.BeautifulSoup('<html><body><span title="Funstuff" class="thisClass">Fun Text</span></body></html>')
print soup.html.body.span['title']
print soup.find('span', {"class": "thisClass"})['title']
于 2012-07-23T18:46:56.320 に答える
1

子のタグは.contentsから入手できます http://www.crummy.com/software/BeautifulSoup/bs4/doc/#contents-and-children あなたの場合、タグがCSSクラスを使用してコンテンツを抽出していることがわかります。

from bs4 import BeautifulSoup
soup=BeautifulSoup('<span title="Funstuff" class="thisClass">Fun Text</span>')
soup.select('.thisClass')[0].contents[0]

http://www.crummy.com/software/BeautifulSoup/bs4/doc/#css-selectors には必要なすべての詳細があります

于 2012-07-23T19:53:57.690 に答える