現在、CSV ファイルと mySQL データベースの間でデータをフォーマットする作業を行っています。MySQLdb ライブラリを使用して接続を管理していますが、フォーマットに問題があるようです。私は mySQL も Python もあまり経験していないことを認めなければなりませんが、実用的なアプローチで、今までほとんどうまくいっていました。
#!/usr/bin/python
# -*- coding: utf-8 -*-
import MySQLdb
QUERY = "SELECT * FROM searches WHERE searchdate BETWEEN '2011-08-08' AND '2011-08-14';"
conn = MySQLdb.connect (unix_socket = '/opt/local/var/run/mysql5/mysqld.sock',host = "localhost", user = "username", passwd= "passwd", db="db")
c = conn.cursor()
c.execute(QUERY)
for row in c.fetchall():
print row
これは、データベースからレコードを抽出するスクリプトです。プロセスの後半で、各行からデータを抽出し、これを CSV にフォーマットしたいと考えていますが、当面の問題は、画面に出力されるデータが次のようになることです。
('\xc3\xa6nima', ' 1', ' 12782027', ' 35', datetime.date(2011, 8, 13))
('\xc3\xa6nima', ' 1', ' 12823616', ' 59', datetime.date(2011, 8, 10))
('\xc3\xa6oc', ' 1', ' 13078573', ' 55', datetime.date(2011, 8, 14))
('\xc3\xa6re', ' 1', ' 12516300', ' 35', datetime.date(2011, 8, 8))
('\xc3\xa6re v\xc3\xa6re deg', ' 1', ' 13145801', ' 59', datetime.date(2011, 8, 13))
('\xc3\xa6re v\xc3\xa6re deg og lammet', ' 1', ' 13145801', ' 59', datetime.date(2011, 8, 13))
('\xc3\xa6re v\xc3\xa6re jesu navn', ' 1', ' 13136667', ' 59', datetime.date(2011, 8, 11))
('\xc3\xa6rlig vuggevise', ' 1', ' 12386933', ' 35', datetime.date(2011, 8, 12))
('\xc3\xa6ror aleina', ' 1', ' 12867037', ' 35', datetime.date(2011, 8, 12))
('\xc3\xa6sj', ' 1', ' 13130891', ' 59', datetime.date(2011, 8, 8))
('\xc3\xa6thenor', ' 1', ' 12555673', ' 35', datetime.date(2011, 8, 10))
私が今理解しなければならない問題は、互換性のある形式でデータを取得する方法です。したがって、データベース内の文字セットにアクセスして UTF-8 に変更する方法と、すべてのデータを再構築する必要があるかどうか、またはこの問題を自動的に処理する方法があるかどうかを知りたいと思います。また、組み込み関数を使用して datatime.date をフォーマットする方法を誰かが教えてくれたら嬉しいです (正規表現と再構築ができることはわかっていますが、おそらくもっと洗練された解決策があるでしょう)。
よろしくお願いします。