0

私はpythonが初めてです。コンテンツを含むこのWebページがあります:

<Response>
<Value type="ABC">107544</Value>
<Value type="EFG">10544</Value>
<Value type="ABC">77544</Value>

ABC を含む行を解析し、数値のみを一時テキスト ファイルに保存したいと考えています。これどうやってするの?

現在、私は持っています

htmlpage = urllib2.urlopen(<URL>)
result = htmlpage.read()
4

3 に答える 3

1

HTML の解析に BeutifulSoup を使用するという提案に賛成しますが、どうしても正規表現を使用したい場合は、次のような方法を試すことができます。

re.findall('(?<=type="ABC">).+?(?=<\/)', text, re.S)
于 2013-03-21T20:14:07.243 に答える
1

結果を に入れるBeautifulSoupと、正規表現なしで非常に簡単にデータを抽出できます

更新しました:

from bs4 import BeautifulSoup

result = '''<div class="test">
             <a href="example">Result 1</a>
            </div>
            
            <div class="test">
             <a href="example2">Result 2</a>
            </div>'''

soup = BeautifulSoup(result)

for div in soup.findAll('div', attrs={'class':'test'}):
    print div.find('a').text

Result 1
Result 2
于 2013-03-21T20:08:33.387 に答える