1

歌詞を抽出するためにいくつかのpythonプログラムを実行しています

私が使用するコード:

    import urllib
    from bs4 import BeautifulSoup
    url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/22143075")
    soup = BeautifulSoup(url.read())
    print soup.find('pre', itemprop='description')

結果は私が必要なものを取得しますが、たとえば余分なタグを使用します。<pre item="description>次に、歌詞 歌詞だけを取得する方法を知っている人はいますか? 構造は pre タグの間に歌詞を入れます よろしくお願いします

4

1 に答える 1

0

見つけたノードのテキスト属性を使用します

import urllib
from BeautifulSoup import BeautifulSoup
url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/2
2143075")
soup = BeautifulSoup(url.read())
desc=soup.find('pre', itemprop='description')
print desc.text
于 2013-09-15T13:02:17.297 に答える