1

ここでいくつかのhtmlを解析しようとしていて、美しいスープを使用しています

ある時点で、次のように特定の div タグを検索します。

print soup.find("div", {"class": "sorteringsvalg Alle"})

返される出力は次のとおりです。

<div class="sorteringsvalg Alle"> Alle  <label class="sorteringtype">
<input checked="" name="type" type="radio" value="Alle"/>(638) </label></div>

私が興味を持っているのは括弧内の数字なので、このデータをさらに処理する必要があります。これに「re」正規表現を使用してみましたが、返されるオブジェクトは文字列として表されないため、機能しません。

4

2 に答える 2

0

内部入力を見つけて、次の兄弟を取得します。

div = soup.find("div", {"class": "sorteringsvalg Alle"})
print div.find("input", value="Alle").next_sibling.strip()

または、CSS セレクターを使用して:

soup.select("div.Alle input[value=Alle]")[0].next_sibling.strip()
于 2015-08-10T19:16:39.453 に答える
0

次のように、タグ内で文字列を取得できます。

print soup.find("label").get_text(strip=True)
于 2015-08-11T11:56:29.847 に答える