1

BeautifulSoup を使用してサイトで Web クロールを実行しようとしています。しかし、div クラス AddressInfo 内のコンテンツを取得しようとするとエラーが発生します。これは、クロールしたいサイトの一部です。

<h4>Altônia</h4>
<div class="addressInfo">
Rua Getulio Vargas, 1201<br>
Centro - Iporã - PR<br>
87550-000<br>
<br>
(44) 3659-2721<br>
<a href="mailto:altoniacentro.pr@escolas.com.br">altoniacentro.pr@escolas.com.br</a><br>
</div>

そして、これは私のコードです:

from urllib import urlopen
from BeautifulSoup import BeautifulSoup
import re

# Copy all of the content from the provided web page
webpage = urlopen('site url....').read()


# Grab everything that lies between the h4 tags using a REGEX
patFinderTitle = re.compile('<h4>(.*)</h4>')

# Grab everything that lies between the class addressInfo tags using a REGEX
patFinderAddress = re.compile('<div class="addressInfo">(.*)</div>') **<- get error here**

そして、これは私が得るエラーです:

raise ValueError('Cannot process flags argument with a compiled pattern') ValueError: Cannot process flags argument with a compiled

パターン

どうすればこれを解決できますか?

4

1 に答える 1