問題タブ [statistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
4613 参照

statistics - オープンソースまたは無料の財務分析プログラム/ライブラリ

Matlab の金融および金融デリバティブ ツールボックスと同様の機能を含むものを探していますが、matlab に費やす現金がありません。金利やリスクなどを簡単に計算できる無料またはオープンソースのライブラリやプログラムに関する情報をいただければ幸いです。

0 投票する
2 に答える
1623 参照

web-applications - JavaEEWebアプリケーションの統計エンジン

私たちはJavaEEWebアプリケーションに取り組んでおり、マーケティング担当者は私たちのサイトの非常に詳細な統計を必要としています。Google Analyticsに似たもので、ユーザーの情報を収集し、サイト内のナビゲーション(ユーザーがどこから来たのか、何をクリックしたのか、どこに行ったのかなど)。

Analyticsのようなサードパーティのサービスに依存することはオプションではありません。

また、この情報をグラフなどで表示したいと考えています。データが収集されると、適切なクエリとその表示方法がほぼ同じになるため、それほど難しくはありません。

車輪の再発明をしたくないのですが、この目標のためにプロジェクトに追加するAPI、フレームワーク、またはその他の種類のライブラリがあるかどうか知っていますか?

0 投票する
2 に答える
593 参照

sql - SQLで逸脱したレコードを除外する

列の平均を取得するために必要なこのデータセットがあります。select avg(x) from yトリックを行います。ただし、より正確な数値が必要です。

高すぎる値または低すぎる値 (スパイク) を持つレコードをフィルタリングして、平均を計算する際にそれらを除外できるようにする方法が必要であると考えました。

0 投票する
3 に答える
1793 参照

logging - log4net ログを分析するツール

log4net ログの分析に使用できるツールはありますか。

特に、スレッド ID で 2 つのメソッド呼び出しを抽出し、2 つの間の期間を分析して、呼び出し期間の統計を作成したいと考えています。

さらに、複数の (100x10Mb) ファイルにまたがる。

grepもそれを行うと思います

0 投票する
1 に答える
105 参照

performance - 生成されたデータを渡し、いくつかの統計を分析させることができるアプリケーションはありますか?

基本的な要件は、C#コード(マネージコードまたはコマンドから定期的にデータを取得できるもの)から、コマンドの種類と実行時間(おそらく他のデータもありますが、現時点で関係している基本データです)に渡すことです。行。そしてそれについていくつかの統計分析を実行します:各コマンドタイプの平均時間、標準偏差、いくつかのチャートがいいでしょうなど。

これをリアルタイムで実行できるものが望ましいかもしれませんが、データを自分で保存し、それを渡して分析することも許容できると思います。

このために何かを書くことはできますが、おそらくこれのために何かがあるはずです。

編集:基本的に低い学習曲線を探して、上記のことを行うことができます。基本的には、手動でコーディングするよりも習得して使用する方が速いものです。

0 投票する
11 に答える
37199 参照

google-analytics - Google gclids をデコードする方法

さて、これに対する最初の反応は「できない」または「分析を使用する」である可能性が高いことを認識していますが、誰かがそれ以上の洞察を持っていることを期待して続けます.

「自動タグ付け」を備えた Google アドワーズ広告は、「gclid」(おそらく「Google クリック ID」) をリンクに追加して、広告対象のサイトに移動します。これはクエリ パラメータであるため、ウェブ ログに表示され、その訪問を広告/キャンペーンに関連付けるために分析によって使用されます。

私がやりたいことは、トラフィックに関する独自の分析を行うために、gclid から有用な情報を抽出することです。その理由は次のとおりです。

  • 統計は不完全ですが、それらを照合すると、どのような仮定を立て、どのように計算したかが正確にわかります。
  • データを残りのデータに結び付けて、コンバージョン率に関してはるかに正確な統計を生成できます。
  • 変換のために JavaScript に頼る必要はありません。

これで、gclid が base64 でエンコードされている (またはそれに近い亜種) ことは明らかであり、その一部は他の部分よりも大きく異なります。それを超えて、私はそれが何に関連しているのかを判断できませんでした.

私がこれを解読する方法についての洞察を持っている人はいますか、またはすでに gclid をコンペやアカウントに関連付けている人はいますか?

私はグーグルの何人かの人々と話しました.彼らのモットーは「悪にならないでください」にもかかわらず、彼らはNDAの下でさえ、この情報を漏らす可能性について議論することを完全に嫌がっていました. 彼らは私たちのウェブ統計を独占していることを気に入っているようです。

0 投票する
2 に答える
1131 参照

performance - IIS6 アプリケーション プールでプロセス固有のパフォーマンス統計を表示する信頼できる方法

Windows Server 2003 の perfmon には、プロセスごとのプロセッサ時間とメモリのワーキング セット統計を取得するカウンター オブジェクトがあります。唯一の問題は、複数のアプリケーション プールがある環境では、正しいワーカー プロセスを確実に識別する方法がないことです。perfmon ではそれらをすべて「w3wp」と呼び、複数ある場合は w3wp、w3wp#1、w3wp#2 などと呼びます。これらの名前でさえ信頼できません。番号はどちらが最初に開始されたかによって異なり、プロセスが破棄されて再起動されるため、アプリ プールがリサイクルされると明らかに変化します。

ASP.NET 固有のカウンターが見つかりませんでした。何らかの理由で、IIS オブジェクトがインスタンスを分離していません。"グローバル" インスタンスが 1 つしかありません。

最終的には、特定の IIS アプリケーション プールの "% Processor Time" カウンターと "Working Set" カウンターだけが必要です。助言がありますか?

0 投票する
3 に答える
4718 参照

language-agnostic - n iid指数確率変数の合計で95%信頼区間を計算する

c実際、信頼区間に一般化してみましょう。共通レートパラメータをa。(レートパラメーターを使用した指数分布の平均aはです1/a。)

nまず、そのようなiid確率変数の合計の累積分布関数を見つけます。cこれを使用して、合計の信頼区間を計算します。合計の最尤推定(MLE)はn/a、つまり、n1回の抽選の平均の倍であることに注意してください。

背景:これは、ランダムなサンプルを介して時間の見積もりを行うために作成しているプログラムで発生します。ポアソン過程に従ってサンプルを取得し(つまり、サンプル間のギャップが指数分布になっている)、nそれらのサンプルがアクティビティX中に発生した場合、アクティビティXの期間の適切な推定値は何ですか?答えはこの質問に対する答えだと確信しています。

0 投票する
3 に答える
521 参照

statistics - ウェブ利用統計

現在の Web 使用統計 (特に Java のバージョン、OS、ブラウザ) を確認するのに適したサイトはどれですか。おそらくこの情報が含まれているため、Google Zeitgeist を把握しようとしていますが、見つかりません。

0 投票する
10 に答える
56532 参照

math - データへの多項式の当てはめ

一連の値(x,f(x))を指定して、データに最適な次数の多項式を見つける方法はありますか?

与えられたデータポイントの次数の多項式を見つけるための多項式補間を知っていますが、ここには多数の値があり、低次の多項式を見つけたいと考えています (最良の線形適合、最良の 2 次、最良の 3 次などを見つけます。 )。最小二乗法に関連している可能性があります...nn+1

より一般的には、多変量関数 (例えば のような点) があり、変数内の特定の(x,y,f(x,y))次数の最適な多項式 ( p(x,y)) を見つけたい場合の答えを知りたいと思います。(具体的には、スプラインやフーリエ級数ではなく、多項式です。)

理論とコード/ライブラリ (できれば Python ですが、どの言語でもかまいません) の両方が役立ちます。