4

私はcPickleとpsycopg2を使用して、いくつかのベクトルをデータベースに保存しています。これはバイナリデータを保存するための私のコードです

binary_vec = cPickle.dumps(vec, -1)
db.cur.execute('''
               INSERT INTO feature_vector (vector, id) 
               VALUES (%s, %s);
               ''', (psycopg2.Binary(binary_vec), thread_id)
db.conn.commit()

ただし、fetchall()を使用してデータをロードし直すと、タイプはbufferになります。このバッファオブジェクトをリスト(vec)に復元する方法がわかりません。

これが私がデータをフェッチする方法です

db.cur.execute("SELECT * FROM feature_vector;")
m = db.cur.fetchall()

結果は次のようになります

[(3169187, <read-only buffer for 0x1002b0f10, size 3462, offset 0 at 0x1004a7430>), 
(3169275, <read-only buffer for 0x1002b0f50, size 3462, offset 0 at 0x1004a7570>), 
(3169406, <read-only buffer for 0x1002b0f70, size 3462, offset 0 at 0x10140b0b0>), 
(3169541, <read-only buffer for 0x10141c030, size 3462, offset 0 at 0x10140b2b0>), 
(3169622, <read-only buffer for 0x10141c050, size 3462, offset 0 at 0x10140b3f0>),...

cPickle.loads(m [0] [1])を使おうとすると、エラーメッセージが返されます。

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: must be string, not buffer
4

1 に答える 1

7

pickle 化された値を Python に自動的に変換するカスタマイズされたタイプキャスターを作成できます。

import cPickle
obj = {'a': 10}
data = cPickle.dumps(obj, -1)

import psycopg2

def cast_pickle(data, cur):
    if data is None: return None
    return cPickle.loads(str(psycopg2.BINARY(data, cur)))

psycopg2.extensions.register_type(
    psycopg2.extensions.new_type(
        psycopg2.BINARY.values, 'BINARY-PICKLE', cast_pickle))

cnn = psycopg2.connect('')
cur = cnn.cursor()
cur.execute("select %s::bytea", [psycopg2.Binary(data)])
cur.fetchone()
# ({'a': 10},)
于 2012-12-04T02:19:02.253 に答える