4 つの列を持つ大規模なデータフレームがあり、そのうちの 2 つは「日付」(datetime
形式) と「ページ」(ファイルとして保存された場所string
) です。データフレームを「ページ」でグループ化し、それを呼び出しpagegroup
、各ページがアクセスされる時間の範囲を知りたい (たとえば、最初のアクセスは 1-1-13 で、最後のアクセスは 1-5-13 だったので、最大最小は 5 日です)。
私はパンダでdate_range
2つの日時を比較するために使用できることを知っていますが、次のようなことを試みています:
pagegroup['date'].agg(np.date_range)
戻り値
AttributeError: 'module' object has no attribute 'date_range'
単純な(日付固有ではない)numpy関数ptp
を試している間、整数の答えが得られます:
daterange = pagegroup['date'].agg([np.ptp])
daterange.head()
ptp
page
%2F 0
/ 13325984000000000
/-509606456 297697000000000
/-511484155 0
/-511616154 0
日付の範囲を計算し、認識可能な日付形式で返す方法を考えられる人はいますか?
ありがとうございました