これまでのところ、これらの文字列を既知のユーザー エージェントと照合することで、ユーザー エージェント文字列のリストからロボットを検出できますが、この方法を使用して予想よりも少ないボットを取得しているため、php を使用してこれを行うには他にどのような方法があるのか 疑問に思っていました。
また、ブラウザまたはロボットがユーザー エージェント文字列を使用して別のブラウザを偽装しているかどうかを検出する方法も探しています。
アドバイスをいただければ幸いです。
編集: これは、次のような行を含むログ ファイルを使用して行う必要があります。
129.173.129.168 - - [11/Oct/2011:00:00:05 -0300] "GET /cams/uni_ave2.jpg?time=1318302291289 HTTP/1.1" 200 20240 "http://faculty.dentistry.dal.ca /loanertracker/webcam.html" "Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.4; en-US; rv:1.9.2.23) Gecko/20110920 Firefox/3.6.23"
これは、アクセス時間以外のユーザーの行動を確認できないことを意味します。