0

次のスクリプトを使用して情報を取得し、郵便ラベルを作成しています。

このスクリプトulは、私の郡のPUBLIC税データベースのクラス「descriptionkeywords」タグからすべてのデータを取得します。

私の問題は、クラス「descriptionkey」の最初の3つliの要素だけをどのようにスクレイプするかです。ulこのクラスはhtmlで100回以上使用されており、郵送先住所情報を含む最初の3つの要素のみが必要であることに注意してください。

li必要な要素だけを取得するには、何を追加する必要がありますか?

スクリプトはうまく機能しますが、取得する情報が多すぎます。

ありがとう

次のコード行は、必要なすべてのデータを取得しますが、必要のliない2つの追加要素も提供します。

a = soup.findAll(attrs={"class" : "description keywords"})

liクラスの最初の3つの要素であるul「説明キーワード」のみを収集する必要があります。

4

1 に答える 1

0
soup.find_all('title', limit=1)

に制限を設定できますfind_all。はまだ呼び出されているため、実際にはコードが大幅に高速化されるわけではありませんfind_all。返される結果が少なくなるだけです。find_next実際に処理を高速化するには、 3 回呼び出すことができます。

http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-the-tree

于 2012-10-05T19:02:57.060 に答える