Webサイトのユーザーページビューを追跡する単純な社内テーブルを実装したいと思います。特定の仮説を対象とせずに、保存するのに役立つデータは何ですか?最終的には、これを使用してグラフや決定木を作成し、ユーザーベースについてより深く学習します。これは静的です(javascriptなし)。
私が考えることができること:
- アクセスされたURL
- HTTPリファー[r]er
- HTTP受け入れ言語
- ブラウザエージェント
- セッションID
- ユーザーID(ログインしている場合)
- 訪問した時間
それはあなたのサイトがどれだけ公開されているかに依存します。サイトで認証が必要な場合は、ユーザー(訪問者)の履歴を追跡できるため、統計をより制御できます。ユーザーが認証を必要としない場合、サーバー変数によって提供される情報に制限されます: HTTP_USER_AGENT ; REMOTE_USER; REMOTE_ADDR; リモートホスト; REMOTE_PORT; HTTP_COOKIE; HTTP_USER_AGENT。
ユーザーがサイトにログオンするたびに、一部の非公開サイトにこのようなものを実装しました。保存している情報は次のようになります。
良いスタートのようですね、
私は訪問者のIPアドレスを保存する傾向があり、それからgeoipルックアップを介して訪問者の場所を取得します。
また、IPを逆引きして、ユーザーが使用しているISPを把握することもできます。これを使用することは決してないかもしれませんが、ダウンストリームキャッシングが問題を引き起こしているという報告がある場合に役立ちます。