1

を使用して Python でリクエストを作成していますrequests

次に、 を使用して、必要なbs4を選択しますdiv。その div 内のテキストの長さをカウントしたいのですが、そこから得られる文字列にはすべてのタグも含まれています。次に例を示します。

<div><a class="some_class">Text here!</a></div>

Text here!すべてのdivandaタグなしで、のみをカウントしたい。

どうすればそれができるか、誰にも分かりますか?

4

1 に答える 1

7

つまり:

tag.text

また

tag.string

tagは使用されているタグを意味しますsoup.find()詳細については、ドキュメントを確認してください。


これは、私が何を意味するかを理解するのに役立つ簡単なデモです。

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<html><body><div><a class="some_class">Text here!</a></div></body></html>', "html.parser")
>>> tag = soup.find('div')
>>> tag
<div><a class="some_class">Text here!</a></div>
>>> tag.string
'Text here!'
>>> tag.text
'Text here!'
>>> 

テキストの長さを数えることについて、ここで使うということlen()ですか?

>>> tag.text
'Text here!'
>>> len(tag.text)
10
于 2015-11-06T13:12:21.043 に答える