私は mysql にこのテーブルを持っています。ここには、個別の ID ごとに各 ITEM の出現 (CNT 列) があります。
ID ITEM CNT
---------------------
01 093 4
01 129F 2
01 AB56 0
01 BB44 0
01 XH7 0
01 TYE2 1
02 093 0
02 129F 3
02 AB56 1
02 BB44 0
02 XH7 2
02 TYE2 2
03 093 9
03 129F 2
03 AB56 0
03 BB44 1
03 XH7 4
03 TYE2 0
......
このデータを MySQL から Python にインポートする効率的な方法を見つけて、リストのリストの形式でクラスタリング手順の項目カウント ベクトルとして使用できるようにしたいと思います。
[[4,2,0,0,0,1],[0,3,1,0,2,2],[9,2,0,1,4,0]]
各リストはIDを表します...私は大量のデータ(数百万行)を扱っているので、パフォーマンスが問題になります..どんな助けでも大歓迎です