私はパンダの比較的初心者であり、これにどのようにアプローチすればよいかわかりません。ヘルプ デスク システムを介したチケット フローを分析しています。生データは次のようになります (さらに多くの列があり、場合によっては何日にもわたります)。
TicketNo SvcGroup CreatedAt ClosedAt
0 4237941 Unix 2013-07-28 03:55:00 2013-07-28 11:01:37.346438
1 4238041 Windows 2013-07-28 04:59:00 2013-07-28 18:25:02.193182
2 4238051 Windows 2013-07-28 05:09:00 2013-07-28 23:11:12.003673
3 4238291 Windows 2013-07-28 05:10:00 2013-07-28 05:32:51.547251
4 4238321 Unix 2013-07-28 01:15:00 2013-07-28 10:09:20
5 4238331 Unix 2013-07-28 01:53:00 2013-07-28 17:42:56.192088
6 4238561 Windows 2013-07-28 02:03:00 2013-07-28 06:34:09.455042
7 4238691 Windows 2013-07-28 02:03:00 2013-07-28 20:54:47.306731
8 4238811 Windows 2013-07-28 03:23:00 2013-07-28 13:15:20.823505
9 4238851 Windows 2013-07-28 04:16:00 2013-07-28 23:51:55.561463
10 4239011 Unix 2013-07-28 04:26:00 2013-07-28 09:27:06.275342
11 4239041 Windows 2013-07-28 04:38:00 2013-07-28 07:55:34.416621
12 4239131 Unix 2013-07-28 08:15:00 2013-07-28 08:46:42.380739
13 4239141 Windows 2013-07-28 01:08:00 2013-07-28 15:37:12.266341
時間ごとのデータを見て、チケットがシフトごとにヘルプデスクをどのように流れているかを確認したいので、中間ステップは次のようになります。
Opened Open Closed CarryFwd
TicketNo SvcGroup Hour
4237941 Unix 3 1 1 0 1
4 0 1 0 1
5 0 1 0 1
6 0 1 0 1
7 0 1 0 1
8 0 1 0 1
9 0 1 0 1
10 0 1 0 1
11 0 1 1 0
4239041 Windows 4 1 1 0 1
5 0 1 0 1
6 0 1 0 1
7 0 1 1 0
(上記のグループ化から) のような最終結果:
Opened Closed CarryFwd
SvcGroup Hour
Unix 3 6 7 47
4 7 10 44
5 1 6 39
6 11 2 48
7 7 3 52
8 5 5 52
9 5 11 46
Windows 3 6 7 22
4 3 10 15
5 5 2 18
6 6 2 22
7 11 11 22
8 2 4 20
9 0 2 18
注: これは時間単位で分類されていますが、日単位、週単位などで確認することもできます。上記に到達すると、サービス グループが勢いを増しているか、遅れをとっているかなどがわかります。
これにアプローチする方法についてのアイデアはありますか? 私が本当に理解できない部分は、CreatedAt から ClosedAt の期間を取得し、それを個別の時間間隔 (時間など) で分割する方法です...
どんなガイダンスも大歓迎です。ありがとう。