次のようなデータセット (dat) があります。
Person IPaddress
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 444.666.44.66
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
これは、特定の期間にわたって Web サイトにログインした個人のインスタンスを反映しています。次のようなデータが必要です。
Person IPaddress Number of Logins
36598035 222.999.22.99 6
37811171 111.88.111.88 5
そのため、同じ人物の複数のエントリではなく、個人ごとに 1 つの行だけがあり、ログイン回数がカウントされます。
また、私の例では、36598035 という人物が複数の IP アドレスでログインしていることに気付くでしょう。これが発生した場合、最終的なデータセットの IP アドレスにモード IP アドレス、つまり個人が最も頻繁にログインした IP アドレスを反映させたいと考えています。