毎日約1e10
行のログ ファイルがあり、それぞれに ID 番号 (15 桁未満の整数)、ログイン時刻、ログアウト時刻が含まれているとします。IDによっては、ログインとログアウトを数回繰り返す場合があります。
質問 1 :
ログインしたIDの総数を数える方法は?(各IDを2回以上数えるべきではありません)
ここでハッシュテーブルを使用しようとしましたが、取得する必要があるメモリが非常に大きい可能性があることがわかりました。
質問 2 :
オンライン ユーザーの人口が最大になる時間を計算します。
1 日の時間を 86400 秒に分割し、ログ ファイルの各行について、オンライン間隔の各秒に 1 を追加すると思います。または、ログイン時刻でログ ファイルを並べ替えることができますか?