4

これはおそらくかなり高度な質問であり、多くの説明が必要ですが、私には多くの説明が必要です。

基本的に、多くのログと追跡を必要とする PHP アプリケーションを開発しています。クリック、インタラクション、パフォーマンスなどを追跡します。太陽の下で何でも。Facebook の Scribe と Yahoo の Chukwa は、どちらもこれをうまく実装しています。私はlog4phpについてほとんど知りません。

私が知りたいのは、この種のロギングがどのように機能するか、具体的には PHP アプリケーションと組み合わせた場合の概要です。ログが処理される時点で停止できます。処理とストレージに Hadoop/Hive を使用したいことは既にわかっています。

また、アプリケーション自体の内部で何が起こっているかについて、かなり低レベルの見方もしたいと思います。たとえば、クリックの動作を取得してロガーに送信するにはどうすればよいでしょうか。また、私が始めるのに役立つ読書をいただければ幸いです。

4

4 に答える 4

6

これを行うためのツールを購入/取得するか、社内で構築することができます。

購入/取得:

1 - Google/Yahoo アナリティクスでページにタグを付ける - これにより、ページビュー、ページ フローのパフォーマンス、キーワードの SEO ランキングなどが追跡されます。

2 - クリック、インタラクション、およびパフォーマンスを含むユーザーの行動を追跡および記録するため。ClickTale ほど優れたものはありませんでした - http://www.clicktale.com/default_e.aspx - ユーザー セッションをビデオで記録し、これらの「ログ ファイル」をサーバーに配置します。

社内: 1 - ログ データベースに送信するフォームに隠しフィールドを作成することもできます。フォームに一意の ID を指定し、送信中のアクションを追跡します。

他にもたくさんあると思いますが、これらが基本です。ただし、これらは PHP 固有のものではありません。

HTH

編集#1:

これはあなたの質問の範囲を超えているかもしれませんが、追跡は必ずしもデータが社内にあることを意味するわけではありません。例としては、記事やページに「いいね」または「掘る」ボタンを追加することが挙げられます。これにより、人気が「記録」されます。facebook または digg.com にアクセスして、サイトの進行状況を確認できます。SEOにも役立ちます。基本的に、それは追跡システムです。そして、それは使いやすいです。コピーしてコードに貼り付けることができる PHP スニペットがあります。WordPress をお持ちの場合は、プラグインがあります。プラグイン検索セクションで「digg」、「like it」を探してください。

Google アナリティクスに戻りますが、クリックの追跡を超えたい場合は、先に進んで目標/目標到達プロセスを作成してください。ユーザーの行動を追跡し、「最も価値のあるキーワードは何ですか?」などの質問に答えます。「すべてのユーザーはどこにドロップしますか?」「各ページの直帰率は?」「自分のサイトへの上位 3 つのエントリ ポイントとトラフィック メディアは?」これらは、SEO/SEM マネージャーが最も懸念している質問です。追跡して理解することは間違いなく良いことです。

ClickTale は、Google アナリティクスが終わるところから始まります。GA はユーザーの行動をページ レベルで記述しますが、フィールド レベルでは記述しません。ヒート マップを持つ ClickTale は、「このページの直帰率が高いことはわかっていますが、なぜですか?顧客にとって問題のあるフィールドはどれですか?」という質問に答えます。「ユーザーが最も多くの時間を費やすページの領域は?」「特定のセクションを再設計する必要があることをグラフィック担当者に証明するにはどうすればよいですか?」.

編集#2

トラフィックの多いサイトでは、ロギング DB をスケーリングする必要があります。報告するときは本当に助かります。私が提案するのは、3 層のデータベース レポート構造です。層 1 = 過去 7 日間、層 2 = 過去 6 か月間、層 = すべて。業務に合わせて変更できます。つまり、データはある層から別の層に移動します。最新のデータをすぐに利用できる状態に保ちます。レポートをできるだけ早く生成したい。単一の巨大な DB は拡張できません。

于 2010-09-13T21:22:30.817 に答える
0

どちらも詳細で十分に説明的であると仮定すると、ユーザーがたどっているパス、リファラー --> 新しい uri をログに記録することで、ユーザーのクリックを監視できます。たとえば、ユーザーが友人の 1 人をクリックした場合、URI をログに記録する必要があります。

Referrer: /users/41251
Target: /users/66257

簡単なクエリとレポートのためにそれらを適切に保存します。ここでのような直接クリックは、ターゲットがリファラーのページにいると想定するため、友人もそうです。より複雑なシナリオがある場合は、明確な uris でそれらを記述してください。たとえば/users/suggestion/14152、推奨される接続についてです。

そのタイムスタンプに追加すると、ユーザーが集中力を失ったり、タブ/アプリケーションを切り替えたり、戻ったりする傾向がありますが、ユーザーが各ページに滞在した時間の非常に大まかな見積もりが得られます.Google アナリティクスは、これをうまく行います.

ヒートマップを使用してユーザーがサイトで最もクリックした場所の概要については、無料 (GPL) のClickheatが気に入っています。

于 2010-09-17T08:26:46.047 に答える
0

ロギングを行っているフロントエンドで、役に立つと思われるサンプル PHP コードを次に示します。

http://www.alphadevx.com/a/85-Logging-Messages-to-Scribe-from-PHP

アーキテクチャに関しては、Scribe には多くの柔軟性があります。各アプリケーション ノードでローカルの Scribe インスタンスを実行し、アプリケーションのローカル ログをローカルホストに記録することをお勧めします。これらのローカル Scribe インスタンスは、混雑していないときに中央の Scribe サーバーにログを記録するように構成できます。そうでない場合は、メッセージをローカルでキューに入れ続けます。実際には、ログがカテゴリ別に集約される中央サーバーでログを使用します。

私は Scribe の大ファンであり、メモリとプロセッサのフットプリントが非常に小さく、構成が非常に簡単であるという点で (ただし、依存関係のためにインストールするのは殺人的です!)、よく設計されていると思います。ドキュメントが不足しているだけです。

于 2010-11-15T13:34:32.800 に答える
0

Check out Splunk

于 2010-09-18T15:57:17.560 に答える