特定のユーザーに対して発生した特定のイベントのカウントであるいくつかの観測があります。例えば
login_count logout_count
user1 5 2
user2 20 10
user3 34 5
これらの変数を他の多くの変数と一緒に PCA にフィードしたいと思います。たとえば、カウントを直接操作する (列をスケーリングする) か、パーセンテージを操作する (後で列をスケーリングする) かを考えています。
login_count logout_count
user1 0.71 0.28
user2 0.66 0.33
user3 0.87 0.13
データを表現するより良い方法はどれですか?
ありがとう