3

3つの異なる方法を使用して、特定のディレクトリの(一意の)訪問者数を抽出しようとしています。*プロファイルを使用する*動的な高度なセグメントを使用する*カスタムレポートフィルターを使用する

小規模なサイトでは、3つの方法で同じ結果が得られます。しかし、大規模なサイト(> 500万回/月)では、プロファイルと高度なセグメントおよびフィルターとの間に大きな不一致が生じます。これはサンプリングが原因である可能性がありますが、ページビューに関しては違いは小さくなります。サンプリングされたデータを使用すると、訪問者の推定が悪化し、差異が大きくなりますか?また、APIから(フィルターまたはプロファイルを使用して)データを抽出する場合、GAがデータがサンプリングされていることを示していない場合でも、異なるデータを取得します。つまり、サンプリングされていないデータを調べています。

もう1つの奇妙な点は、プロファイルのページビューがフィルターよりも多いのに対し、訪問者数はフィルターとプロファイルの方が多いことです。また、プロファイルにフィルターを適用して、サンプルデータを使用するように強制しました。これも、フィルターおよびセグメントデータと非常によく似た結果を取得します。

           profile  filter  segment  filter@profile
unique     25550    37778   36433    37971 
pageviews  202761   184130  n/a      202761

私が達成しようとしているのは、使用するプロファイルがなくなったときに、ユニークな訪問者に関するある程度正確なデータを取得する方法を見つけることです。

不一致のあるその他のデータは、次のGoogleドキュメントにあります:https ://docs.google.com/spreadsheet/ccc?key = 0Aqzq0UJQNY0XdG1DRFpaeWJveWhhdXZRemRlZ3pFb0E

4

2 に答える 2

4

Google Analytics(無料版)は1か月あたりわずか10 mioページのインタラクション[0](ページビューとイベント、「track」で始まるトラッカーメソッドはインタラクションです)[1]を追跡するため、おそらく大規模なサイトのデータはすでに大量にありますサンプリングされた(500万人の訪問者のそれぞれが2つ以上のインタラクションを持っていると思います)[2]。アドホックレポートは最大で1つのmioデータポイントのみを使用するため、サンプルのサンプルがあります。自然に集計された値は、サンプルサイズが小さいほど影響を受けます。

また、データ制限はAPIアクセスにも適用されると確信しています(Googleによると、「超過ヒットが処理される保証はない」とのことです)。したがって、大規模なサイトの場合、APIはサンプリングされた(または不完全な)データも返します-したがって、サンプリングされていないデータを実際に見ることはできません。

違いについては、アドホックレポートが異なればサンプルも異なるため、結果も異なります。GAを使用すると、とにかく絶対数に頼りすぎて、一般的な傾向を探す必要はありません。

[1] Analytics Premiumは、1か月あたり50 mioのインタラクションを追跡します(Googleからのサポートがあります)が、1年あたり15万米ドルで提供されます

[2] Googleは、大規模なサイトで「_setSampleRate()」を使用して、データ制限を超えた後のランダムなヒットまたはミスではなく、月の各日のデータを実際にサンプリングしたことを確認することをお勧めします。


データ制限:

http://support.google.com/analytics/bin/answer.py?hl=en&answer=1070983)。

setSampleRate:

https://developers.google.com/analytics/devguides/collection/gajs/methods/gaJSApiBasicConfiguration#_gat.GA_Tracker_._setSampleRate

于 2012-11-08T16:32:43.150 に答える
1

はい、特に訪問者数の場合、サンプリングされたデータの精度は低くなります。

また、2日間で50万回のページビューを見逃しているのを見ましたが、数日後にレポートに表示されました。また、さまざまなインターフェイスからさまざまな結果が表示されるのも驚きではありません。Google Analyticsの品質は、よりリアルタイムにしようとしても低下しています。それらのコードベースはAPI間で一貫していないようであり、それらのアルゴリズムはマップ全体にあります。

私は通常、同じメトリックとレポート方法を使用しているため、結果は互いに比較可能です。また、検証と健全性チェックとして、Gaug.esと連携してGAを実行します。その余分なデータを使用して、私はGAで最も自信のあるレポート方法を選択し、それだけに依存しています。

于 2012-11-08T05:22:29.950 に答える