エンコードに問題があります。
私のcsvファイル(UTF-8でエンコード):
Id,Title,FullDescription
55408086,Injection Molding Product Designer,• ツーリングの経験が有利です • 自動車の経験は必須です
そして私のpythonコード(簡略化):
# -*- coding: utf-8 -*-
import csv
import codecs
with codecs.open('D:\\Downloads\\Train_rev2.csv', 'rb', encoding='utf-8') as csv_file:
data = csv.reader(csv_file, delimiter=',')
data.next()
for row in data:
print (row[0], row[1], row[2])
これは以下を出力します:
('55408086', '射出成形製品設計者', '\xe2\x80\xa2 ツーリングの経験は優遇 \xe2\x80\xa2 自動車の経験は必須')
次に、データをデータベースに挿入します(UTF-8 Unicode(utf8)をエンコードしたMYSQL )。間違ったエンコードでデータを取得しています:
55408086,Injection Moulding Product Designer,• Tooling experience is an advantage • Automotive experience is as must