問題タブ [probability]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - ヒストグラムに一致するポイントを生成するにはどうすればよいですか?
私はシミュレーションシステムに取り組んでいます。すぐに、いくつかのシミュレーション入力に対する実際の値の分布に関する実験データ (ヒストグラム) が得られます。
シミュレーションの実行時に、測定された分布に一致するランダムな値を生成できるようにしたいと考えています。元のヒストグラムを保存せずにこれを行うことをお勧めします。いくつかの良い方法は何ですか
- 分布を表す一連のパラメータにヒストグラムをマッピングしますか?
- 実行時にこれらのパラメーターに基づいて値を生成しますか?
編集: 入力データは、いくつかの異なる種類のイベントのイベント期間です。種類が異なれば分散機能も異なると思います。
java - 累積標準正規分布関数を計算する Java ライブラリはどれですか?
プロジェクトでは、数式を使用した仕様があり、実装する必要があります。これらの式には、フロートを取り、確率を出力する累積標準正規分布関数が存在します。関数は Φ で表されます。この関数を計算する Java ライブラリはありますか?
math - 順列と組み合わせのインタビュー
直感に反するので、これは良いものです。
3 分の 2 が同じ色で、3 分の 1 が別の色のボールで満たされた壷を想像してみてください。ある人が骨壷から 5 個のボールを取り出したところ、4 個が赤で 1 個が白であることがわかりました。別の人が 20 個のボールを描いたところ、12 個が赤で 8 個が白であることがわかりました。壷に赤いボールが 3 分の 2 と白いボールが 3 分の 1 入っていることを確信できるのは、2 人のうちどちらでしょうか? 各個人はどのオッズを与えるべきですか?
正解はわかっていますが、オッズの計算がよくわからないかもしれません。誰でも説明できますか?
math - 取得したユーザー名のサンプリングからサイトのユーザーベースのサイズを推測する方法
この情報を公開していないサイトのユーザーベースのサイズを見積もりたいとします。
人々は、さまざまな確率でさまざまなユーザー名を取得している可能性が高くなります。たとえば、ユーザー名「nick」がシステムに存在しない場合、ユーザーベースは非常に小さい可能性があります。ユーザー名「starbaby」を使用すると、はるかに大きなサイトになる可能性があります。それは単純なベイズ問題のようです。
サイトが異なれば、許可されるユーザー名のスペースも異なる可能性があるという問題があります。最大の問題は、スペースなどの一般的な文字の合法性だと思います。以前の配布を汚す可能性のあるもう1つの問題は、必要な名前が使用されたときにサイトが名前を提案するのか、それとももっとクリエイティブな名前を自分で考えさせるのかということです。
さまざまなサイズのシステムでユーザー名が発生する頻度のトレーニングセットをどのように構築できますか?固定幅バケットに分類するのではなく、ベイズを使用して数値推定を行う方法はありますか?
python - 偏ったコインのフリップをシミュレートするにはどうすればよいですか?
公平なコイントスでは、H または T が 50% の回数発生します。
しかし、確率 'p' で H を、確率 '(1-p)' で T を与えるコインをシミュレートしたいと思います。
このようなもの:
python - Pythonでバイアスされたダイをシミュレートするにはどうすればよいですか?
N面バイアスダイをシミュレートしたいですか?
algorithm - サイコロの目で現れる数字の頻度を決定する
ゲームの場合、特定のサイコロを振ったときに特定のサイコロが出る頻度を決定しようとしています。私は知っています...その質問は奇妙に思えます。実数で説明してみましょう。
したがって、1つのサイコロの場合、各番号の頻度は同じになります。1〜6は同じ回数表示されます。
2つのサイコロの場合、状況は異なります。5,6,7が最も頻繁にロールされると思いますが、スペクトルの両端の数字は表示されないか、まったく表示されません(1の場合)。このリストを計算して、頻度の高いものから低いものへと適切な順序で表示する方法を知りたいです。
何かご意見は?
@duffymo-それを思い付くためのある種のアルゴリズムがあるとはいえ、本当に素晴らしいでしょう。上記の方法では、多くの手作業による数字の選択と配置が必要になるようです。私のダイカウントが10まで動的である場合、それを手作業で行うのは非効率的で面倒だと思います。:)
python - Python での確率分布
それぞれがありそうもない変数を持つキーがたくさんあります。これらのキーのいずれかをランダムに選択したいのですが、可能性が低い (可能性が高い) オブジェクトよりも、可能性が低い (キー、値) が選択される可能性が低いことを望んでいます。何か提案があれば、できれば私が使用できる既存の python モジュールがあるかどうか疑問に思っています。それ以外の場合は、自分で作成する必要があります。
random モジュールをチェックアウトしました。これを提供していないようです。
それぞれが 2,455 個のオブジェクトを含む 1000 個の異なるオブジェクト セットに対して、このような選択を何百万回も行う必要があります。各セットは相互にオブジェクトを交換するため、ランダム チューザーは動的である必要があります。2,433 オブジェクトの 1000 セット、つまり 2,433 百万オブジェクト。低メモリ消費は非常に重要です。そして、これらの選択はアルゴリズムの大部分ではないため、このプロセスを非常に高速にする必要があります。CPU 時間は限られています。
どうも
アップデート:
わかりました、私はあなたの提案を賢く検討しようとしましたが、時間がとても限られています...
二分探索木のアプローチを調べましたが、リスクが高すぎるようです (複雑で複雑です)。他の提案はすべて ActiveState レシピに似ています。私はそれを取り、より効率的にすることを期待して少し修正しました:
確実性の合計と最大の確実性を動的に維持することで、効率が向上することを期待しています。さらなる提案は大歓迎です。皆さんのおかげで、時間と労力を大幅に節約でき、効果を高めています。信じられないほどです。どうも!どうも!どうも!
更新 2:
一度により多くの選択肢を選択できるようにすることで、より効率的にすることにしました。これは、本質的に動的であるため、私のアルゴでは精度が許容範囲内に失われます。とにかく、ここに私が今持っているものがあります:
まだ試していません。ご意見/ご提案がございましたら、お気軽にお寄せください。どうも!
Update3:
私は一日中、Rex Logan の回答のタスクに合わせたバージョンに取り組んできました。オブジェクトと重みの 2 つの配列ではなく、実際には特別なディクショナリ クラスです。Rex のコードはランダムなインデックスを生成するので、これは非常に複雑です... 私はまた、私のアルゴで起こることに似たようなテスト ケースをコーディングしました (しかし、実際に試してみるまではわかりません!)。基本的な原則は次のとおりです。キーが頻繁にランダムに生成されるほど、再度生成される可能性は低くなります。
どんなコメントでも大歓迎です。@Darius: あなたの二分木は複雑すぎて私には複雑です。そして、その葉を効率的に取り除くことができるとは思いません... Thx all
statistics - 同時確率の組み合わせ
確率分布 (バイオインフォマティクスに関連) の式を計算しようとしていますが、2 つの異なるソースからの確率変数に関する情報を組み合わせるのに問題があります。基本的に、ここにシナリオがあります: 3 つの離散確率変数 X、A & B があります。X は A と B に依存します。A と B は X を介してのみ関連付けられます。つまり、A と B は X から独立しています。式: P(X, A) および P(X, B)。P(X, A, B) を計算する必要があります。これは連鎖律の単純な適用ではありません。
P(A) が使用可能であるため、最初の式から P(X | A) を導き出すことができます。B は A から独立して観測されることは決してなく、P(B) はすぐには利用できません。せいぜい、A を周辺化することで近似できますが、式 P(A, B) は閉じた形式を持たないため、統合はトリッキーです。
情報を破棄せずに P(X, A, B) を導出する方法について何か考えはありますか? よろしくお願いします。
アミット