データベースからデータをロードし、DataFrame を作成しています。
db_resultset = self.result.fetchall()
df = DataFrame(db_resultset)
df.columns = self.result.keys()
pivoted_data = df.pivot(index='id', columns='item')
data =
id item val
1 A 10
2 A 25
1 B 12
1 C 15
2 C 2
1 D 7
2 D 9
...
pivoted_data =
A B C D
1 10 12 15 7
2 25 NaN 2 9
...
pivoted_data.corr()
そして、次のようなエラーにつながるペアワイズ相関などを計算したいと思います。
File "/.../pandas/core/frame.py", line 4469, in corr
numeric_df = self._get_numeric_data()
File "/.../pandas/core/frame.py", line 4989, in _get_numeric_data
return self.ix[:, []]
File "/.../pandas/core/indexing.py", line 34, in __getitem__
return self._getitem_tuple(key)
File "/.../pandas/core/indexing.py", line 224, in _getitem_tuple
retval = retval.ix._getitem_axis(key, axis=i)
File "/.../pandas/core/indexing.py", line 342, in _getitem_axis
return self._getitem_iterable(key, axis=axis)
File "/.../pandas/core/indexing.py", line 408, in _getitem_iterable
not isinstance(keyarr[0], tuple)):
ピボットされた一連のデータに対して分析を実行する最良の方法は何ですか? バックを DataFrameに変換することを考えましpivoted_data
たが、これは理想的な解決策とは思えません。
**編集:
ジェフのコメントに応えて:
pivoted_data.get_dtype_counts() =
object 319