-2

4 つの列を持つ大規模なデータフレームがあり、そのうちの 2 つは「日付」(datetime形式) と「ページ」(ファイルとして保存された場所string) です。データフレームを「ページ」でグループ化し、それを呼び出しpagegroup、各ページがアクセスされる時間の範囲を知りたい (たとえば、最初のアクセスは 1-1-13 で、最後のアクセスは 1-5-13 だったので、最大最小は 5 日です)。

私はパンダでdate_range2つの日時を比較するために使用できることを知っていますが、次のようなことを試みています:

pagegroup['date'].agg(np.date_range)

戻り値

AttributeError: 'module' object has no attribute 'date_range'

単純な(日付固有ではない)numpy関数ptpを試している間、整数の答えが得られます:

daterange = pagegroup['date'].agg([np.ptp])
daterange.head()

                           ptp
page                          
%2F                          0
/            13325984000000000
/-509606456    297697000000000
/-511484155                  0
/-511616154                  0

日付の範囲を計算し、認識可能な日付形式で返す方法を考えられる人はいますか?

ありがとうございました

4

1 に答える 1