私はパンダ0.13.1を使用しています。タイムゾーンを使用して、階層インデックスの 2 つのタイムスタンプでデータにインデックスを付ける必要があると仮定すると、このアプローチはうまく機能します。
import pandas as pd
dti1 = pd.DatetimeIndex(start=pd.Timestamp('20000101'), end=pd.Timestamp('20000102'), freq='D', tz='EST5EDT')
dti2 = pd.DatetimeIndex(start=pd.Timestamp('20000102'), end=pd.Timestamp('20000103'), freq='D', tz='EST5EDT')
pd.MultiIndex.from_arrays([list(dti1), list(dti2)])
私は得る:
MultiIndex(levels=[[2000-01-01 00:00:00-05:00, 2000-01-02 00:00:00-05:00], [2000-01-02 00:00:00-05:00, 2000-01-03 00:00:00-05:00]],
labels=[[0, 1], [0, 1]])
その間
pd.MultiIndex.from_arrays([dti1, dti2])
タイムゾーンの単純なインデックスを返します。
MultiIndex(levels=[[2000-01-01 05:00:00, 2000-01-02 05:00:00], [2000-01-02 05:00:00, 2000-01-03 05:00:00]],
labels=[[0, 1], [0, 1]])
どちらもタイムゾーンを認識して、2 つが同じものを返すことを期待します。これは期待されていますか?