概念的な質問があります。
Alexa Internet などの企業が、特定のサイト (私自身のものではない) の全体的なトラフィックと各ページのトラフィックをどのように決定するのか疑問に思っています。技術的な回答をいただければ幸いです。この機能を設計するとしたら (複雑だと思いますが、仮説としては...)、どうしますか?
前もって感謝します。
概念的な質問があります。
Alexa Internet などの企業が、特定のサイト (私自身のものではない) の全体的なトラフィックと各ページのトラフィックをどのように決定するのか疑問に思っています。技術的な回答をいただければ幸いです。この機能を設計するとしたら (複雑だと思いますが、仮説としては...)、どうしますか?
前もって感謝します。
1つの方法は、1つ以上のコアルーターに接続することです。そこから、ディープパケットインスペクションを実行して、トラフィックがどこに向かっているのか、どのページにアクセスしたのかなどを確認できます。
もう1つの方法は、ユーザーがどこに行ったかを記録し、その情報をあなたに送信するブラウザーツールバーをインストールすることです。これがAlexaの仕組みだと思います。
3番目の方法は、Webサイトの所有者に、分析を実行してそのデータを送信するJavaScriptを少しインストールさせることです。これがGoogleのやり方です。
4番目の方法は、上記のいずれかを実行している企業からそのデータを購入することです。
Alexa は、Alexa ツールバーまたはブラウザー拡張機能を使用するインターネット人口のサブセットのブラウジング セッションからデータを推定することにより、Web サイトのトラフィックを推定します。これは本当にランダムなサンプルではないため、そのようなデータの正確性について疑問が生じます: http://en.wikipedia.org/wiki/Alexa_Internet#Accuracy_of_ranking_by_the_Alexa_Toolbar
Alexa ツールバーをインストールすると、ブラウザのユーザー エージェントが変更されるため、適切なユーザー エージェント文字列を含むリクエストのサーバー ログをスキャンすることで、Alexa にデータを提供しているサイト訪問者の割合を推定できます。