27

以下の2つの列でデータフレームをグループ化しました

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': [7L, 8L, 9L],
                   'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median()

結果は次のとおりです。

            b    c
a name            
1 hello  4.75  7.5
3 foo    6.00  9.0

name結果の中央値 (この場合は)のフィールドにアクセスするにはどうすればよいhello, fooですか? これは失敗します:

df.groupby(['a', 'name']).median().name
4

4 に答える 4

32

as_index = Falseグループバイ時に設定

df = pandas.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df.groupby(["a", "name"] , as_index = False).median()
于 2014-10-31T05:39:52.823 に答える
26

インデックス値を取得する必要があります。それらは列ではありません。この場合レベル1

df.groupby(["a", "name"]).median().index.get_level_values(1)

Out[2]:

Index([u'hello', u'foo'], dtype=object)

インデックス名を渡すこともできます

df.groupby(["a", "name"]).median().index.get_level_values('name')

これは、整数値を渡すよりも直感的であるためです。

を呼び出すことで、インデックス値をリストに変換できます。tolist()

df.groupby(["a", "name"]).median().index.get_level_values(1).tolist()

Out[5]:

['hello', 'foo']
于 2013-10-05T20:03:57.467 に答える
5

reset_index()groupby の結果で、name 列にアクセスできるようになったデータフレームを取得することもできます。

import pandas as pd
df = pd.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df_grouped = df.groupby(["a", "name"]).median().reset_index()
df_grouped.name
 0    hello
 1      foo
 Name: name, dtype: object

単一の列で操作を実行すると、返されるのは multiindex のシリーズであり、単にそれに適用pd.DataFrameしてから reset_index を適用できます。

于 2013-10-06T00:05:15.170 に答える