問題タブ [data-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database-design - 顧客プロファイリングシステムに関する提案:本、記事など
C#を使用して、独自のEコマースWebサイトの顧客プロファイリングプロジェクト(Google Analyticsと類似していますが、同一ではありません)に取り組みます。私はこの種のプロジェクトにかなり慣れていません。また、顧客プロファイリングプロジェクトもまったく新しいプロジェクトです。それについて何か提案をいただけますか?
「ウェブサイトの訪問データの追跡」と「追跡データの分析」の2つの部分があるべきだと思います。
それについて何か提案をいただけますか?ありがとう:
- この種のプロジェクトには、どのようなデザインパターンが最適ですか?(パイプラインとフィルター?または他の?)私はC#を使用しています。
- どのようなデータベースが最適ですか?RDBMSまたはドキュメントデータベース?
- 追跡されたデータを格納するためのデータベーステーブルをモデル化する方法は?
- Googleでこのテーマを検索するために使用できるキーワードは何ですか?
- 読むべき記事や本を教えていただけますか?(本を読む時間があまりないので、記事の方がいいです)
- あなたが私が学ぶ必要があると思う他のこと。
前もって感謝します!
database - 情報の視覚化に役立つ無料のデータ アナライザーはありますか?
ソフトウェアを評価するためのアンケートを作成し、n 人に提出しました。アンケートには多くの質問があり、次のようにすべて 1 つの選択肢があります。
- 何歳ですか?(13-15) (19-25) (26-35) (35歳以上)
- あなたの資格は何ですか?(大学生) (卒業) (博士)
.... 次の点について 1 から 4 の評価で意見を述べてください: a1 a2 ... すべての回答を Excel と Mysql データベースの両方にコピーしました。評価された各側面の年齢と評価。相関関係を視覚化するのに役立つ Linux 用の無料ツールはありますか? 例えば。13 歳から 18 歳の間のほとんどの人は側面 1 を評価しました。悪い、19 歳から 25 歳はかなり悪い、26 歳から 35 歳はかなり良いです...
2 変量、3 変量データ (散布図など) の多くの種類の視覚化を知っていますが、それらを取得する方法がわかりません。
私の最悪の英語ですみません、私の問題を理解していただければ幸いです...事前に感謝します!
apache - Apache ログから uv(Unique Visitor) の数を取得する方法
ApacheログからUV番号を取得する方法の分析アルゴリズムを知りたいです。このようなログ:
ありがとう。
または、awstats や webtrends がユニークな訪問者を獲得するためにどのように機能するかを知っている人。
awstats( http://awstats.sourceforge.net/docs/awstats_glossary.html ) では、ユニーク ビジターは IP アドレスで追跡されるため、複数のユーザーが同じ IP (自宅やオフィス ネットワーク)、それらは 1 人の一意の訪問者としてカウントされます。詳細については、こちらhttp://digdeeply.info/archives/03191870.html
statistics - 悪いビデオストリームを検出する方法
ストリーミングビデオサイトでデータ分析を行おうとしています。問題が自分の側にあるのかユーザーの側にあるのかを判断するために、ストリームの帯域幅の平均と標準偏差の収集を開始しました。私がよくわからないのは、通常のストリームがどのように見えるかを決定する方法です。
通常のストリームがどのように見えるかを理解するために、私は次のものを見つけることを考えていました。
- 平均値-通常の帯域幅とは
- StdDevofMeans-人口の帯域幅はどのくらい変化しますか
- StdDevsの平均-通常の変動量はどれくらいですか
- StdDevsのStdDev-平均StdDevはどのくらい変化しますか
これらの統計は意味がありますか?
基本的に、私は低帯域幅や高可変帯域幅などを探して、不良ストリームを検出しようとしています。したがって、いくつかのベースラインを見つけて、外れ値を探すことができると考えました。
また、各サンプルのすべてのデータを保持することは現実的ではないため、集合体統計のみを処理できます。他に何かあれば、ログに記録することをお勧めします。これも大きな助けになります。
mysql - MySQLセット内の2つのログエントリ間の時間差を選択するにはどうすればよいですか?
分析を行う必要のあるログエントリのセットがたくさんあります。私がやりたいのは、ログのセットごとに、開始エントリと完全なエントリの間の時間差を選択することです。どうすればこれを行うことができますか?
matlab - MatLabのデータセットの最大点と最小点
こんにちは私は、30秒間にわたって繰り返されるエクササイズの最大値と最小値のみを使用して、MatLabでマトリックスを作成する方法を見つけようとしています。
たとえば、データセットがある場合:
私が望んでいた結果は次のとおりです。
この関数は、絶えず変化する波形のピーク値のみをプロットします。
私が試したコードは次のとおりです。
事前に返信してくださった方に感謝します。
ジャレド。
matlab - 添え字のインデックスは、実数の正の整数または論理値のいずれかでなければなりません。MatLab での findpeaks の使用
私はMatLabでfindpeaksを使用して波形の最大点と最小点を問題なく見つけてきましたが、過去20分ほどでエラーが発生しました:
??? 添え字のインデックスは、実数の正の整数または論理値のいずれかでなければなりません。
理由がわかりません。テスト データを使用して簡単な演習を試みても、同じエラーが発生しました。たとえば、データセットがある場合:
コードを使用しました:
私は結果を期待します:
しかし、何らかの理由で、これはもはや当てはまりません。
お知らせ下さい。
r - R では、多数の変数を使用して重回帰を実行した後、重要な変数だけを抽出する方法
R で重回帰を実行した後、回帰の要約は重要な変数を星で示します。私が取り組んでいるデータセットには 2000 近くの変数があり、R によって識別される重要な変数には 50 を超える変数が含まれています。回帰の要約から、重要な変数のリストを単独で取得する方法はありますか?
r - 2つのテーブルをリンクし、関連付けテーブルを探す
私はr-studioで作業しており、すでにロードされている2つのテーブルをリンクしてから、相関ルールを探しています。
セットアップ:
2つのデータテーブルがあります。
- [user.id、rating、timestamp]フィールドを持つ「uData」
- [user.id、age、gender、occupation]のフィールドを持つ「uUser」
uDataでは、各ユーザーは複数回表示される可能性がありますが、uUserでは、各ユーザーは1回だけリストされます。r-studiosインポートデータセットを使用してデータをロードしました。arules、datasets、graphics、grDecies、lattice、Matrix、methods、stats、およびutilsパッケージを使用しています。
最終目標:
評価、年齢、性別の相関ルールを見つける
Q1
uDataテーブルを反復処理し、uUserから各行の年齢と性別を取得する必要があると思います。新しいテーブルを作成する方法や、最終目標を達成するために新しいテーブルが必要かどうかがわかりません。
Q2
最終的な目標は、相関ルールを見つけようとすることです。私は使用しようとしています
ルール<-apriori(_ _、parameter = list(supp = .5、conf = .9、target = " _ "))
いくつかのチュートリアルを調べた後、ダミーデータで機能するようになりましたが、ロードしたデータでは機能しません。各行にトランザクションのラベルを付ける方法がわかりません。私が試してみました
トランザクション=read.transactions(uUser)
しかし、これには警告があります。どんな助けでも大歓迎です。
uDataからのデータの数行は次のとおりです。
uUserからのデータの数行は次のとおりです。