問題タブ [web-analytics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-analytics - GoogleAnalyticsとOmnitureのリンクを生成する
GoogleAnalyticsとOmnitureのURLを作成しようとしています。
GAは非常にシンプルで、これらのURLはhttp://www.google.com/support/analytics/bin/answer.py?hl=en&answer=55578を使用して作成できます。
Omnitureリンクがどのように構築されているか知っている人はいますか?彼らはこの種のURLをサポートしていますか?
java - HTML ページを解析し、コンテンツ (タイトル、テキストなど) をデータベースに保存します。
HTMLページを解析し、広告、JSなどをフィルタリングしてタイトル、テキストを取得するためのオープンソースツールを知っている人はいますか? 私のアプリケーションのフロント エンドは LAMP に基づいています。そのため、html ページを解析して Mysql に保存する必要があります。そして、フロントページにこれらのデータを入力します。
私はいくつかのツールを知っています: Heritrix、Nutch。しかし、彼らはクローラーのようです。
ありがとう。ジョセフ
web-analytics - 訪問/発信元の asp.net mvc Web サイトを追跡する
これが可能かどうかはわかりません。確かにこれを試したことはありませんが、サイトにアクセスしたときに誰かがどこから来たのかを知りたいという顧客がいます。Google、Bing、別の Web サイトからのリンクなどからのものでした。さらに重要なことは、訪問が通常の SSO によるものなのか、それともアドワーズ広告のような有料の広告であったのかを知りたいということです。
これについて誰かの考えをいただければ幸いです。
どうもありがとう
python - Webサーバーログからユーザーセッションをカウントする無料の実装?
Webサーバーのログアナライザー(Urchinなど)は、多くの場合、多数の「セッション」を表示します。セッションは、限られた継続的な時間セグメント内で個人が行った一連のページ訪問/クリックとして定義されます。IPアドレス、および多くの場合、ユーザーエージェントやOSなどの補足情報、および15分や30分などのセッションタイムアウトしきい値を使用して、これらのセグメントを識別しようとします。
特定のWebサイトおよびアプリケーションでは、ユーザーはCookieを使用してログインおよび/または追跡できます。これは、サーバーがセッションの開始時刻を正確に知ることができることを意味します。私はそれについて話しているのではなく、Webサーバーがセッションを追跡しないときにヒューリスティックにセッションを推測すること(「セッションの再構築」)について話している。
たとえばPythonでコードを記述して、上記の基準に基づいてセッションを再構築しようとすることはできますが、車輪の再発明はしたくありません。私は約400K行のサイズのログファイルを見ているので、スケーラブルなアルゴリズムを使用するように注意する必要があります。
ここでの私の目標は、ログファイルから一意のIPアドレスのリストを抽出し、IPアドレスごとに、そのログから推測されるセッションの数を取得することです。絶対的な精度と正確さは必要ありません...かなり良い見積もりは大丈夫です。
この説明に基づく:
次の2つの条件が有効な場合、新しいリクエストが既存のセッションに追加されます。
IPアドレスとユーザーエージェントは、セッションにすでに挿入されているリクエストと同じです。- リクエストは、最後に挿入されたリクエストから15分以内に実行されます。
理論的には、値がペアである辞書(ユーザーエージェントによってキー設定)の辞書(IPによってキー設定)を構築するPythonプログラムを作成するのは簡単です:(セッション数、最新セッションの最新の要求)。
ただし、パフォーマンスの調整に多くの時間を費やすリスクがある可能性があるため、既存の実装が利用可能な場合はそれを使用することをお勧めします。
参考までに、誰かがサンプル入力を求めないように、ログファイル(サニタイズ済み)の行を次に示します。
apache - 処理時間を理解し、クエリ文字列を解析できる Web ログ アナライザーはありますか?
Apache が保存できる「処理時間」フィールド (%D) を報告し、クエリ文字列をインテリジェントに解析できる Web ログ アナライザーを知っている人はいますか?
AWStats や Webalyser などの通常の疑わしいものを調べましたが、これらの機能のいずれかを提供しているようには見えませんでした。
理想的には、単純な「ページ」リクエストではなく、特定のクエリ文字列パラメーターについてレポートできるようにすることができます。たとえば、私のサーバーが次のヒットを示した場合:
/someurl?blah=X&whatever=Y
/someurl?whatever=Y&blah=Z
それをインテリジェントに解析できるようにしたいので、「whatever=Y」のレポートを要求すると、両方の URL がグループ化されますが、「blah=X」についてレポートすると、それらは別々にカウントされますか?
これを行うことができる既製のツールの提案はありますか? FOSSまたはその他。
はい、この種のことを自分で解析する awk または sed スクリプトを書くことができることはわかっていますが、私のためにその大変な仕事をして、それを素敵なチャートで提示してくれる人を探しています。
google-analytics - 不明確な Google アナリティクス API の割り当て制限
私は最近、いくつかの GA クォータ制限に達したと思われるアプリケーションを修正していましたが、明確でないことがいくつか見つかりました。
- 4 つの同時リクエストの制限は、アプリケーションごと、Web プロパティごと、またはその他に適用されますか?
- 特定の 1 秒間に 10 件のリクエストまたは4 件の同時リクエストの制限を破ると、GA が 503 ServiceUnavailable エラーで応答を停止するまでにどれくらいの時間がかかりますか?
- アプリケーションごとのクォータは、アプリケーション名の文字列のみを参照していますか? 異なる GA アプリケーション文字列を使用して 2 つの異なる Web アプリケーションを実行しています。どちらのアプリも同じ IP アドレスから GA API に接続します。この場合、アプリケーションごとのクォータがアプリケーション文字列ごとに個別に計算されると期待できますか?
- 503 ServiceUnavailable 応答で送信されたステータス コードはどこかに文書化されていますか? rateLimitExceededが 1 秒あたり 10 リクエストの制限を指していると確信できますか? 503 応答の原因を特定するにはどうすればよいですか?
ところで、文書化されているよりも強力なクォータ制限が時々有効になる可能性はありますか?
たとえば、GA が 503 ServiceUnavailable 応答で応答する可能性はありますか?
よろしく、
パベル
javascript - Google Analytics または Yahoo Web Analytics を使用して Facebook ページへの訪問を追跡するにはどうすればよいですか?
最近これを調べたところ、Facebook ファン ページで FBML ページを使用すると、fb:google-analytics タグまたはイメージ タグを追加してページ アクセスを追跡できることがわかりました。ただし、「写真」や「壁」など、他のFacebookタブページへの訪問を追跡する方法は見つかりませんでした。
これを行う方法はありますか?
ありがとう
web-analytics - ウェブサイト分析 - 方法?
私が構築した CMS システムに分析機能を追加することを検討しています。サードパーティのパッケージやサービスを使用するつもりはありません。訪問者と時間ごとにページ訪問を記録したいと思っています。
個人を特定したり、単一のサイトを超えて追跡したりするつもりはありません。訪問者が昨日と同じかどうか知りたいのですが。
時間、ページID、訪問者ハッシュ(md5など)を格納する単純なテーブルを考えています。これは、「訪問者 X が 5 日ごとにサイトにアクセスする」タイプのことであり、訪問者 Y が 1 ページから 2 ページ、14 ページから 1 ページに戻ったこと、およびその他の統計と言えます。
簡単に取得できる時間とページID、それが訪問者IDです。私はIPを取得できますが、それはサイトを介した1回の訪問を追跡します. 再訪問を追跡するために確実に使用することはできません。DHCP が IP の使用を望ましくない NAT にする - 私は思う。クライアント側の Cookie を使用できると思いますが、使用したくありません。
信頼できる、または IP よりも信頼性の高い、リピーターを識別する方法はありますか?
google-analytics - Google Analyticsとリアルタイム分析の比較:Chartbeat vs Clicky vs Mixpanel
Chartbeat、Clicky、Mixpanel、およびGoogleAnalyticsに関する意見や経験を聞いてみたいと思います。
人々はGoogleとこれらの他のリアルタイムシステムの1つを展開していますか?それとも、リアルタイムシステムはGoogleに取って代わるのに十分ですか?
リアルタイムシステムのうち、どれを使用しますか、またその理由は何ですか?
ありがとう!
javascript - 外部リンクがクリックされた回数を追跡するにはどうすればよいですか?
私は大学と提携しているサイトを持っており、特定の教育プログラムを持つ別のサイトにリンクしたいと考えています。
このリンクが当社の Web サイト内からクリックされた回数を追跡するにはどうすればよいですか?