私はpythonが初めてです。私がやりたいことは、今年のグラストンベリー フェスティバルで発表されたすべてのバンドを、python と美しいスープを使用して抽出することです。すべてのバンドをテキスト ファイルにダンプし、最終的に各アーティストのトップ トラックに基づいて Spotify プレイリストを作成したいと考えています。
www.efestivals.co.uk/festivals/glastonbury/2013/lineup.shtml#から抽出したいアーティストのリスト(実際には、[金曜日] タブではなく [AZ] タブに表示したい)
最初に端末にバンドを出力しようとしましたが、空白の結果が得られます。これが私が試したものです
from bs4 import BeautifulSoup
import urllib2
#efestivals page with all glastonbury acts
url = "http://www.efestivals.co.uk/festivals/glastonbury/2013/lineup.shtml#"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
bands = soup.findAll('a')
for eachband in bands:
print eachband.string
基本的に、AZ タブにアクセスし、各バンドを抽出するには助けが必要です。私も確認済みのバンド( が付いているものimg src="/img2009/lineup_confirmed.gif"
)だけ欲しいです。私はhtmlにあまり詳しくありませんが、これは妥当な出発点のようです。