urllib2 を使用して、HTML ファイルから歌詞を保存しようとしました。さて..これはコードです:
generate_url = 'http://azlyrics.com/lyrics/' + artist_split + '/' + title_split + '.html'
try:
response = urllib2.urlopen(generate_url)
except urllib2.HTTPError:
print "Lyrics doesn't exist. Please try again."
time.sleep(0.75)
UMM.lyrics_from_track()
read_lyrics = response.read()
#Parsing HTML file containing lyrics
parser = etree.HTMLParser()
tree = etree.parse(StringIO.StringIO(read_lyrics), parser)
lyrics = tree.xpath("//div[@style='margin-left:10px;margin-right:10px;']/text()")
print ''
print '\033[32m-----------------------------------------\033[0m'
for words in lyrics:
print str(words).strip()
print '\033[32m-----------------------------------------\033[0m'
print ''
save = raw_input("Do you want to save this lyrics in a txt file in current working directory? [Y/N] ")
if save == 'y' or save == 'Y':
f = open(artist + '_' + title + '.txt', 'w')
f.write(str(lyrics).strip())
f.close()
print 'Return to main menu.'
time.sleep(0.75)
UMM.read_information()
elif save == 'n' or save == 'N':
print 'Return to main menu.'
time.sleep(0.75)
os.system('clear')
UMM.read_information()
else:
print 'Incorrect choice.'
time.sleep(0.75)
UMM.lyrics_from_track()
歌詞を txt ファイルに保存する場合の出力は次のとおりです。
['\r\n', '\r\nどんなに離れていてもとても近い', "\nこれ以上ないほど心から", '\n私たちが誰であるかを永遠に信頼する', '\nそして他に何も重要ではない', '\n', '\nこのように自分自身を開いたことは一度もありません', '\n人生は私たちのものです. 私たちは私たちのやり方で生きています. n', '\n信頼を求め、あなたの中に見つけます', '\n私たちにとって毎日何か新しいことを見つけます', '\n別の見方のために心を開いてください', '\nそして他には何も重要ではありません', '\n', '\ n彼らが何をしているか気にしたことは一度もない', '\n彼らが知っていることを気にしたことがない',心臓"、 '\n私たちが誰であるかを永遠に信頼する', '\nそして他に何も問題はありません', '\n', '\n彼らが何をするか気にしたことはありません', '\n彼らが知っていることを気にしたことはありません', '\nしかし私は知っています', '\ n', '\nこのように自分自身を開いたことは一度もありません', '\n人生は私たちのものです. 私たちは私たちのやり方で生きています. 、「\n信頼を求め、あなたの中に見つけます」、「\n私たちにとって毎日何か新しいことを見つけます」、「\n別の見方のために心を開いてください」、「\nそして他に何も問題はありません」、「\n」、「\n気にしたことはありません彼らが言うことのために'、'\n彼らがプレイするゲームを気にしたことがない'、'\n彼らがすることを気にしたことがない'、'\n彼らが知っていることを気にしたことがない'、'\nそして私は知っている'、'\n'、'\ nどんなに遠くてもとても近い',「\nこれ以上のことはありません」、「\n私たちが誰であるかを永遠に信頼する」、「\n他に何も問題はありません\r\n'、'\r\n']
節を列に入れるにはどうすればよいですか?