以下の参照コードを使用して、サイトからいくつかのアイテム名をスクレイピングしています。
# -*- coding: cp1252 -*-
import csv
import urllib2
import sys
import time
from bs4 import BeautifulSoup
page = urllib2.urlopen('http://www.vodafone.de/privat/tarife/red-smartphone-tarife.html').read()
soup = BeautifulSoup(page)
soup.prettify()
items = soup.findAll('div', {"class": "txtBox"})
for item in items:
print unicode(item.string).encode('utf8').strip()
問題:このコードを実行すると、18 個のアイテムの名前の代わりに 18 個の「なし」が出力されます。
出力スニペット:
>>>
None
None
None
None
None
None
None
None
None
None