問題タブ [probability-density]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - matlabでpdfの対数を表示する関数
標準正規分布で 50 の密度を計算する必要があります。実際には、結果は によって 0 に戻りpdf('norm',50,0,1)
ます。その対数を表示しようとすると、 では機能しませんlog(pdf('norm',50,0,1))
。R ではdnorm(50,log = TRUE)
、MATLAB で同様の機能を実行できますか? 見つかりませんでした。ありがとう
matlab - matlab でランダムな離散分布を生成する clean メソッド
よくあることですが、matlab で任意の離散分布を生成する必要があります。私はこれを書くことができます:
この 2 行をどこにでも書くのは避けたいのですが、この機能をカプセル化すると、よりクリーンなソフトウェアになります。ソース管理の理由から本格的な関数を書くことは避けたいと思います。これを複数のリポジトリで使用する必要があります。それは確かに独自のサブモジュールに値しません!
理想的には、無名関数の行に沿ったソリューションが必要です (ローカル関数はスクリプトで許可されていないため、使用できません)。少し遅い実行: ( http://www.mathworks.com/matlabcentral/answers/50195-is-it-possible-to-write-several-statements-into-an-anonymous-function )。
c - (非常に) まばらな確率密度関数をモデル化するにはどうすればよいですか?
実行中のコンピューターによってメモリ上で行われる基本的な読み取り要求と書き込み要求を複製するトラフィック ジェネレーターを作成したいと考えています。
しかし、実行中のコンピューターはメモリ参照に (非常に強い) 局所性も示し、64 ビット アドレス空間では非常に狭い範囲のアドレスのみが参照されます (実際、私はこれを 1 つのベンチマークでテストし、数十億ページの約 9000 ページをテストしました。オファーに触れます)。
このようなスパース確率密度関数をモデル化するための良い方法は何ですか (理想的には C または C++ で) - ベンチマークの確率はありますが、あまり厳密に従う必要はありません (どのような場合でもベンチマーク参照を使用できますが、もう少し柔軟なものが必要です)。
明確にするために、各ページからの読み取り回数に関するデータもありますが、私が興味を持っているのは、ページのシーケンスを選択することです。(コメントで提案されたマルコフ連鎖のアイデアがこれを行う方法かもしれません)
javascript - javascript d3およびdcを使用した確率密度関数
Javascript (d3 および dc ライブラリ) (R の密度関数と同様) を使用してデータセットの確率密度関数を作成しようとしていますが、どうすればよいかわかりません。
それはできますか?
ありがとう
PD: jqplot の場合: http://services.mbi.ucla.edu/jqplot/examples/kcp_pdf.html
algorithm - 空になる可能性のある複数の配列から優先的にランダムなアイテムを取得する方法
3 つのリストから 1 つの項目をランダムに選択したいと考えています。各リストは異なる選択確率を表しています。
高、中、低の「優先度」の 3 つのリスト (3 つの配列にすることもできます) があります。
この3つのリストから優先確率で1つ選びたい
例: 高から 70% の確率で中盤から 20%、低から 10%
ただし、リストの一部は空である可能性があります (すべてではない)。
いずれかのリスト内に少なくとも 1 つの項目がある
それを行うアルゴリズム(任意の言語ですが、C#Java Pythonを好む)を探しています
次のコード(Python)を試しましたが、空の状態が原因で機能しません。アイテムがあってもアイテムが選択されないことがあります。
r - 類似性に基づく非構造化テキストのクラスタリングと最適なクラスタ数の計算
私はデータ マイニングの初心者で、解決しようとしているクラスタリングの問題へのアプローチを最初に定式化しようとしています。
それぞれが特定のスタイル (ユニークな言葉の使用など) を持つ x 人の作家がいるとします。彼らはそれぞれ、複数の短いテキストを書きます。たとえば、俳句です。私たちは著者からこれらの何百もの俳句を収集し、文脈分析を使用して、そもそも何人の著者がいたかを俳句から理解しようとします (大戦争の後、著者の数の記録をどういうわけか失ってしまいました!)。
これらの俳句ごとに単語のハッシュ テーブルを作成するとします。次に、各ベクトル間の類似した単語の繰り返しを調べる距離関数を作成できます。これにより、ある種の k-mean クラスタリング関数を実装できます。
私の問題は、クラスターの数、つまり著者の数を確率的に測定することです。これにより、最適な適合が得られます。
何かのようなもの:
ここでの唯一の制約は、著者 (またはクラスター) の数が無限大になるにつれて、確率のシグマが 1 に収束する必要があるということです。
この2番目の部分を実装する方法について、誰か考えや提案はありますか?
matlab - ガウス混合モデル 1D データ
を使用して、1D データ (1000*1 行列) を 3 つのガウス分布にモデル化しました。
このようなものをプロットするにはどうすればよいですか?
与えられたポイントが各クラスに属する確率を示します。