0

データベースからデータをロードし、DataFrame を作成しています。

db_resultset = self.result.fetchall()
df = DataFrame(db_resultset)
df.columns = self.result.keys()
pivoted_data = df.pivot(index='id', columns='item')

    data =
    id  item  val
     1    A    10
     2    A    25
     1    B    12
     1    C    15
     2    C    2
     1    D    7
     2    D    9
     ...

    pivoted_data =
         A    B    C    D
    1   10   12   15    7
    2   25   NaN   2    9
    ...

pivoted_data.corr()そして、次のようなエラーにつながるペアワイズ相関などを計算したいと思います。

File "/.../pandas/core/frame.py", line 4469, in corr
    numeric_df = self._get_numeric_data()
  File "/.../pandas/core/frame.py", line 4989, in _get_numeric_data
    return self.ix[:, []]
  File "/.../pandas/core/indexing.py", line 34, in __getitem__
    return self._getitem_tuple(key)
  File "/.../pandas/core/indexing.py", line 224, in _getitem_tuple
    retval = retval.ix._getitem_axis(key, axis=i)
  File "/.../pandas/core/indexing.py", line 342, in _getitem_axis
    return self._getitem_iterable(key, axis=axis)
  File "/.../pandas/core/indexing.py", line 408, in _getitem_iterable
    not isinstance(keyarr[0], tuple)):

ピボットされた一連のデータに対して分析を実行する最良の方法は何ですか? バックを DataFrameに変換することを考えましpivoted_dataたが、これは理想的な解決策とは思えません。

**編集:

ジェフのコメントに応えて:

pivoted_data.get_dtype_counts() =
object    319
4

1 に答える 1