19

次のデータフレームがある場合

>>> df = pd.DataFrame({'Name': ['Bob'] * 3 + ['Alice'] * 3, \
'Destination': ['Athens', 'Rome'] * 3, 'Length': np.random.randint(1, 6, 6)}) 
>>> df    
  Destination  Length   Name
0      Athens       3    Bob
1        Rome       5    Bob
2      Athens       2    Bob
3        Rome       1  Alice
4      Athens       3  Alice
5        Rome       5  Alice

名前と目的地でグープできます...

>>> grouped = df.groupby(['Name', 'Destination'])
>>> for nm, gp in grouped:
>>>     print nm
>>>     print gp
('Alice', 'Athens')
  Destination  Length   Name
4      Athens       3  Alice
('Alice', 'Rome')
  Destination  Length   Name
3        Rome       1  Alice
5        Rome       5  Alice
('Bob', 'Athens')
  Destination  Length Name
0      Athens       3  Bob
2      Athens       2  Bob
('Bob', 'Rome')
  Destination  Length Name
1        Rome       5  Bob

しかし、次のような新しいマルチインデックス付きデータフレームが必要です

                Length
Alice   Athens       3
        Rome         1
        Rome         5
Bob     Athens       3
        Athens       2
        Rome         5

Dataframe(grouped)マルチインデックスのデータフレームを取得するような方法があるはずですが、代わりにPandasError(「DataFrame コンストラクターが正しく呼び出されていません!」) が表示されます。

これを取得する最も簡単な方法は何ですか? また、 groupby オブジェクトをコンストラクターに渡すオプションがあるかどうか、または単に間違っているかどうかを知っている人はいますか?

ありがとう

4

1 に答える 1

17

同様にインデックス付けされた行を集約していないため、列名のリストを使用してインデックスを設定してみてください。

In [2]: df.set_index(['Name', 'Destination'])
Out[2]: 
                   Length
Name  Destination        
Bob   Athens            3
      Rome              5
      Athens            2
Alice Rome              1
      Athens            3
      Rome              5
于 2013-01-13T18:51:30.860 に答える