アプリケーションへのユーザー アクセス ログのテーブルがあります。サンプルデータは次のとおりです。
userid | login | duration (seconds)
--------------------------------------------------------
1 | 2013-04-30 09:24:07.127 | 21456
2 | 2013-04-29 09:22:05.023 | 26477
1 | 2013-04-30 10:24:07.787 | 86543
2 | 2013-04-30 12:55:55.846 | 32237
1 | 2013-04-30 08:24:12.347 | 92231
私の目標は、このデータからいくつかの指標を取得することです。過去 1 週間の最小、最大、および平均の同時ログイン ユーザーを取得する必要があります。誰かがより良いアイデアを持っていない限り、同時接続の意味のある平均を取得するには、間隔を選択する必要があると思います. 私が間違っている場合は修正してください。もしそうなら、私はそれで問題を抱えるべきではないと思います。問題を引き起こしているのはその最小値と最大値です。私はSQLでこれをやろうとしていますが、役に立ちません。問題は、接続間のオーバーラップをどのように測定するかを理解しようとしています。これを引き出してPythonで実行する必要があります。100,000 行以上あるので、少し面倒かもしれませんが、レポートを生成する必要があるのは 1 日に 1 回だけなので、効率は私の最大の関心事ではありません。
申し訳ありませんが、サンプル コードがありません。ここから始める方法がよくわかりません。助けてくれてありがとう。