1

美しいスープのタグをクエリしています

scriptResults = soup3('script')
soup3 = BeautifulSoup(page3)

見つかった各スクリプトの結果が head タグまたは body タグのどちらに含まれているかを判断するにはどうすればよいですか?

頭を抽出し、本文を抽出してから、それぞれのスクリプト タグを個別に確認するのが最も簡単な方法でしょうか?

4

1 に答える 1

1

BS に渡す前にソースを分割できます。

parts = html.split('</head>')
head = parts[0]
body = parts[1]

head_soup = BeautifulSoup(head)
body_soup = BeautifulSoup(body)

この後、各スープに script タグが存在するかどうかを確認するだけです。

于 2013-03-29T13:40:47.093 に答える