最近、大量のサーバー ログ データにアクセスできるようになりました (新しいジョブで)。私は大学で機械学習の経験があります。ログデータには、サーバーログやデータベースアクセスログなどがあります。このようなデータから、どのような学習ができるのだろうかと考えていました。
私が試した小さなことの 1 つは、過去 1 週間のデータに基づいて 1 日の特定の時間のリクエスト数を予測することでした。これは問題ないように見えましたが、これは些細なことです。そう、
- そのようなデータからどのような学習ができるのでしょうか?
- 以前のスパマーの使用パターンに基づいて、IP が広告に対してスパム クリックを行う可能性を予測している可能性があります (はい、会社はそれに関与しています)。
- トラフィックが急増する時間を予測している可能性があります。
- 特に活用している既存のツール/プロジェクトはありますか?
- 同様のことについて話している興味深いリソース/論文はありますか?
- また、サーバー上で一定時間以上のデータ関連のプロセス アクティビティ。これは学習に役立ちますか?