ページを取得するために python2.7 と lxml を使用しています。以下のエラーが発生し続けます。
(<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError('ascii', u'Approximate Dimensions: 4\xbd" x 4" x 7" (assembled)', 25, 26, 'ordinal not in range(128)'), <traceback object at 0x7f9198ac48c0>)
私は次のことを試しました:
doc = lxml.html.document_fromstring(html)
for el in doc.iter('h2'):
el.text_content().decode('utf-8','ignore')
OR
el.text_content().encode('ascii', 'ignore')
これらのエラーを解決するにはどうすればよいですか? 1) テキスト ファイルに保存してから、2) テキスト ファイルを MySQL にアップロードできるようにする必要があります。
ありがとう