問題タブ [non-uniform-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2066 参照

java - 効果的な Java 項目 47: ライブラリを知って使用する - 欠陥のあるランダム整数メソッドの例

ジョシュが与えられた上限を持つ正の乱数を生成する欠陥のあるランダムメソッドの例ではn、私は彼が述べている2つの欠陥を理解していません。

本の方法は次のとおりです。

  • 彼は、n が 2 の小さなべき乗である場合、生成される一連の乱数は短時間で繰り返されると述べています。これはなぜですか?のドキュメントにRandom.nextInt()Returns the next pseudorandom, uniformly distributed int value from this random number generator's sequence.、 n が小さい整数の場合、シーケンスが繰り返されることはありませんが、なぜこれは 2 のべき乗にのみ適用されるのでしょうか?
  • 次に、n が 2 のべき乗でない場合、ある数値は他の数値よりも平均して頻繁に返されると彼は言います。Random.nextInt()均一に分散されたランダムな整数を生成する場合、なぜこれが発生するのですか? (彼はこれを明確に示すコードスニペットを提供していますが、なぜこれが当てはまるのか、これがnが2の累乗であることとどのように関連しているのかわかりません)。
0 投票する
3 に答える
5605 参照

python - 指定された比率でのランダムな不均一分布

「A」、「B」、「C」の 3 つのラベルがあります。

100 個の要素を持つランダムなリストを生成したいのですが、その 60% が "A"、30% が "B"、10% が "C" です。

これどうやってするの?(私はpythonが初めてです。この質問がばかげていないことを願っています。)


編集: 私の質問はこの質問とは少し異なります: 与えられた (数値) 分布で乱数を生成する

コメントのように、正確に 60% を「A」にしたいのですが、すべての要素が 60% の確率で「A」になるわけではありません。したがって、 numpy.random.choice() は私にとって解決策ではありません。

0 投票する
1 に答える
155 参照

security - ハッシュの mod のソルト ハッシュを取得すると、非常に不均一な分布になるのはなぜですか?

ランダムに生成された一意の ID が 100 万個あります。

私が行った場合:

次に、これにより、ID が 0 から 999 の間の整数に均等に分散され、各整数に約 1000 の ID がマップされます。

これにソルトを追加して、ハッシュを再度取得すると、次のようになります。

その結果、分布は完全に不均一になります。各 ID の結果はもちろん [0,999] の範囲ですが、この範囲内の一部の整数には ID がマップされていませんが、他の整数には数千の ID がマップされています。

これにより、値の分布が非常に不均一になるのはなぜですか?

これを調整して、100 万の ID と特定のソルトに対して [0,999] の範囲の整数が均一に分布するようにするにはどうすればよいですか? 潜在的に非常に大きな入力スペースをより小さなスペース (サイズ 1000 など) に縮小する中間ステップを維持したいと考えています。

SHA-256 ハッシュを使用しています。

非常に不均一な結果を示す Python コードを次に示します。

0 投票する
0 に答える
152 参照

matlab - センサーデータから等間隔データを作成し、高速フーリエ変換を適用

次のセンサー サンプル データがあります。

つまり、ある時0は価値が0.30865225195884705あり、ある時60は価値があるということ0.14355185627937317です。

ご覧のとおり、データは等間隔ではありません。つまり、データのタイム スタンプが異なっています。この信号に高速フーリエ変換を適用するため、これが必要です。

センサー データから等間隔のデータを作成できる方法や実装はありますか? (MATLAB を使用)

0 投票する
1 に答える
327 参照

cluster-analysis - 非正規分布データをクラスタリングするための距離メトリック

クラスター化したいデータセットは、スケールと範囲が異なる (負、正、両方) 約 1000 個のサンプルと 10 個の特徴で構成されています。scipy.stats.normaltest() を使用して、どの機能も正規分布していないことがわかりました (すべての p 値 < 1e-4、データが正規分布から取得されたという帰無仮説を棄却するのに十分小さい)。しかし、私が知っているすべての距離測定は、正規分布データを想定しています (データがどれほど不均一であるかに気付くまで、マハラノビスを使用していました)。この状況では、どのような距離尺度を使用しますか? それとも、すべての機能を正規化し、それがバイアスを導入しないことを願うだけでよいのでしょうか?