2

私は、会社の Web サイトのログ テーブルを分析するタスクを担当しています。このテーブルには、特定のセッションの Web サイト全体でのユーザーのクリック パスが含まれています。私の会社では、ユーザーの「クリック パス」に基づいて傾向を理解し、特定しようとしています。そうすることで、年齢や地域などに基づいて、特定の「クリック パス」を取るユーザーのグループを特定します。

タイトルからわかるように、私は BI とその機能にまったく慣れていないので、次のことを考えていました。

  1. 私たちの目標は達成可能ですか?
  2. これを行うにはどうすればよいですか?

私は現在、オンラインの本や見つけた他の電子書籍を読んでいます。すべての兆候は、これがシーケンス クラスタリングによって可能であることを示唆しているようです。正確な実装と関連する微調整は現在私にはわかりません。したがって、そのような事業を直接経験したことがある人がいる場合は、ここで共有していただければ幸いです。

乾杯!

4

4 に答える 4

2

あなたが探しているのはAssociation Rule Miningと呼ばれるものです。私は BI に特に詳しくありませんが、 Apriori アルゴリズムとそのバリエーションのいくつかの実装を含むWekaを参照することをお勧めします。

于 2009-09-17T21:09:07.700 に答える
2

これは、既存のログ ファイルでは役に立ちません... (ただし、回答の検索に失敗した場合の代替手段です)

Google アナリティクスは無料で、いくつかのカスタム変数 {年齢など} を設定して、トラフィックがどこに行くのかを確認できます.. (個々のユーザーが何をしているかを確認することはできません..) 正確にいつやろうとしているかではなく、無料で、あなたが探しているものに近づけることができます

本当に優れた Analytics が必要な場合は、Omniture (高価) を検討してください。ただし、複雑な Web サイト レポートを作成するための最高の機能です。ユーザーがどのようにアクセスしてサイトと対話するかを追跡する多くの電子商取引シナリオで使用されます。

ウェブサイトの分析はたくさんあります。自分で分析する前に、いくつか調べてみてください。自分の目標に集中するのに役立つかもしれません。

于 2009-09-17T21:35:26.867 に答える
0

Webサーバーのログファイルを読むのは簡単ではないので、まずオープンソースまたは商用のWeb分析ソフトウェアパッケージ(Googleで検索してください)から始めます

データを他のテーブル (ユーザー テーブルと年齢など) にマッピングしたり、独自のソリューションをブレンドして Web セッション ログを他のデータとマッピングしたりできるものもあります。

それ以外の通常のSQLクエリは、分析の問題を解決します。

select user.id 
 from user, log l1, log l2, log l3
 where user.id = l1.userid and l1.type = first step
  and user.id = l2.userid and l2.type = next step
  and user.id = l3.userid and l3.type = last step
  and l1.sessionid = l2.sessionid and l2.sessionid = l3.sessionid

生データを BI フレームワークにロードしても、それほど簡単にはならない場合があります。このようなクエリの結果を BI フレームワークにロードすることは理にかなっています

Web アプリケーションによっては、長時間実行されているセッション ID などがある場合、またはセッション ID を変更している場合に、実際のセッションを特定するのに問題が生じる場合があります。それが問題である場合は、Web 分析を実際の Web サーバー コードにロールバックして、長時間実行状態をシミュレートし、代わりにそれを記録できるようにする必要があります。

于 2009-09-17T21:02:39.500 に答える
0

そのタスクにはニューラル ネットワークを使用できるようです。おそらくパーセプトロン

ニューラル ネットワークの経験はありますが、専門家ではありません。集合知のプログラミング: スマートな Web 2.0 アプリケーションの構築
という本を強くお勧めします。Python を知らなくてもチェックしてください。

于 2009-09-02T16:27:31.320 に答える