python - Python: 特定の文字を含む行の Web コンテンツを解析し、ファイルに保存します

Question

私はpythonが初めてです。コンテンツを含むこのWebページがあります：

<Response>
<Value type="ABC">107544</Value>
<Value type="EFG">10544</Value>
<Value type="ABC">77544</Value>

ABC を含む行を解析し、数値のみを一時テキストファイルに保存したいと考えています。これどうやってするの？

現在、私は持っています

htmlpage = urllib2.urlopen(<URL>)
result = htmlpage.read()

score 1 · Accepted Answer

HTML の解析に BeutifulSoup を使用するという提案に賛成しますが、どうしても正規表現を使用したい場合は、次のような方法を試すことができます。

re.findall('(?<=type="ABC">).+?(?=<\/)', text, re.S)

score 1 · Accepted Answer

結果をに入れるBeautifulSoupと、正規表現なしで非常に簡単にデータを抽出できます

更新しました：

from bs4 import BeautifulSoup

result = '''<div class="test">
             <a href="example">Result 1</a>
            </div>
            
            <div class="test">
             <a href="example2">Result 2</a>
            </div>'''

soup = BeautifulSoup(result)

for div in soup.findAll('div', attrs={'class':'test'}):
    print div.find('a').text

Result 1
Result 2

python - Python: 特定の文字を含む行の Web コンテンツを解析し、ファイルに保存します

3 に答える 3

更新しました：

Related

Reference