サーバー ログの HttpReferer 文字列を解釈しようとしています。空の値がかなり多いようです。
これらの空の値のうち、ブラウザに URL を直接入力した人による直接ヒットによるものと、Referer の送信を妨げるある種のブロッキング ユーティリティによるものの数がどれくらいあるのか疑問に思っています。
参照をブロックする可能性のあるツール、ブラウザー、または「アノニマイザー」を使用している人が何人いるのか、私にはまったくわかりません。入力はありますか?
サーバー ログの HttpReferer 文字列を解釈しようとしています。空の値がかなり多いようです。
これらの空の値のうち、ブラウザに URL を直接入力した人による直接ヒットによるものと、Referer の送信を妨げるある種のブロッキング ユーティリティによるものの数がどれくらいあるのか疑問に思っています。
参照をブロックする可能性のあるツール、ブラウザー、または「アノニマイザー」を使用している人が何人いるのか、私にはまったくわかりません。入力はありますか?
実際には、ISPの制限が原因である可能性が高いと思います。私のISP(BT、英国)は、それを(おそらくルーターで)フィルターで除外していることを知っています。
実は、ブロックは実際には、ISPによって提供されることが多いソフトウェアファイアウォールであるZoneAlarmによって配置されています。
Firefoxの「WebDeveloper」拡張機能を使用して個人的に無効にします。これは、そのページにアクセスするために使用した検索用語を強調する「役立つ」サイトがあるためです。
おかげで、私は蛍光ペンプラグインをインストールするか、ページ内の単語を検索することができます。
私はブログ アプリでこれらすべてをログに記録していました。ほぼすべてのボットがリファラー情報を送信することはありません。
それが除外されているのか、それとも人が URL を入力しただけなのかについて、経験に基づいた推測を行うことができるはずです。
最初のヒットにはリファラーがなく、画像/CSS などの読み込みにはリファラー情報がある場合、URL を直接入力しただけです。
画像や CSS を使用せずに HTML のみをプルダウンする場合は、ボット (またはおそらく Lynx を使用) である可能性が最も高くなります。
リファラーなしで HTML、画像、CSS をプルダウンすると、除外されます。
一部のウイルス対策ソフトウェアは遅延しており、「セキュリティ」上の理由からこれを開始しています。
リファラー追跡を使用してランダムなボットスパムの要点を排除する電子メールフォームがあり、一部の人々はそれが機能しないとうめきました。
完全に素晴らしいわけではありませんが、リファラーヘッダーの使用法は、「悪意を持って人々がどこから来たのかを監視する」よりもはるかに優れています。
(たとえば、一部のウイルス対策パッケージは、電子メールの動作を完全に停止することが知られています。クライアントは、あなたがその会社について聞いたことがないゴミを取り除くように指示するまで、あなたに電話をかけてあなたのせいを知らせます。 40回目、彼らは耳を傾け、彼らの問題は魔法のように解決します)
リファラー追跡は、サイト内の状態を維持するのに非常に役立ちます。(クッキーを必要とせずに)
リファラー追跡は、ユーザーの発信元がサイト自体からのものであることを確認するのに非常に役立ちます(Cookieは必要ありません)。
サードパーティのサイトがリファラーを介してデータをリークし、受信者がそれを確認することで、プライバシーに関する正当な懸念がありますが。
それで:
3rd-party => site # referrer preferred blank
local => local # referrer preferred kept
少なくともここでは、外部ソースからの「ホットリンク」と内部リンクを簡単に区別できます。
また、このため、SSL Webサイトからのクロスドメイン参照は、一部のブラウザーによってデフォルトでブロックされます。