3

私は次のデータフレームを持っています:

df = pd.DataFrame({
'Trader': 'Carl Mark Carl Joe Joe Carl Joe Carl'.split(),
'Product': list('AAAABBAA'),
'Quantity': [5,2,5,10,1,5,2,3],
'Start' : [
    DT.datetime(2013,1,1,9,0),
    DT.datetime(2013,1,1,8,5),
    DT.datetime(2013,2,5,14,0),
    DT.datetime(2013,2,5,16,0),
    DT.datetime(2013,2,8,20,0),                                      
    DT.datetime(2013,2,8,16,50),
    DT.datetime(2013,2,8,7,0),
    DT.datetime(2013,7,4,8,0)]})

次の方法でインデックスを配置しようとすると:

df = df.set_index([df.Start, df.Trader, df.Product])

インデックスに使用されている列は削除されません。次を使用して明示的に指定した場合でも:

df = df.set_index([df.Start, df.Trader, df.Product], drop=True)

これはバグですか、それとも私のコードに誤りがありますか?

ありがとう

アンディ

4

1 に答える 1

7

パラメータは列名の配列ですが、これらのシリーズではありません:

In [9]: df.set_index(['Start', 'Trader', 'Product'])
Out[9]: 
                                    Quantity
Start               Trader Product          
2013-01-01 09:00:00 Carl   A               5
2013-01-01 08:05:00 Mark   A               2
2013-02-05 14:00:00 Carl   A               5
2013-02-05 16:00:00 Joe    A              10
2013-02-08 20:00:00 Joe    B               1
2013-02-08 16:50:00 Carl   B               5
2013-02-08 07:00:00 Joe    A               2
2013-07-04 08:00:00 Carl   A               3
于 2013-05-27T09:32:25.167 に答える