問題タブ [random-sample]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1503 参照

r - 未知の確率分布からのサンプル

長さ約 100k のベクトルがあり、値は 0 から 1 で、地理的な場所での生息地の適合性を表しています。一部の値は非常に小さいですが、それらの多くは 0.9 などであるため、合計は 1 よりもはるかに大きくなります。

各サンプルの長さは 6 (置換なし) で、場所が選択される確率はその場所のベクトルの値によって重み付けされます。

以下ダミーデータ。何か案は?

0 投票する
6 に答える
15468 参照

bash - シェルスクリプトの乱数生成

var=$RANDOM乱数を作成しますが、たとえば0から12のような範囲を指定するにはどうすればよいですか?

0 投票する
4 に答える
5952 参照

algorithm - ジョイント、離散、確率分布関数から数値的にサンプリングする方法

ランダムサンプリングで再作成する必要がある2D「ヒートマップ」またはPDFがあります。IE私は開始位置を示す2D確率密度マップを持っています。元のPDFと同じ確率で開始位置をランダムに選択する必要があります。

これを行うには、最初にジョイントCDF(累積密度関数)を見つけてから、ランダムな背番号を選択してCDFをサンプリングする必要があると思います。それは私が立ち往生しているところです。

PDFの結合CDFを数値で見つけるにはどうすればよいですか?両方の次元に沿って累積合計を実行しようとしましたが、正しい結果が得られませんでした。統計に関する私の知識は私を失敗させています。

編集ヒートマップ/PDFは[x、y、z]の形式です。ここで、Zは各x、yポイントでの強度または確率です。

0 投票する
5 に答える
1959 参照

c# - 特定のランダムな名前を選択する方法

私はWindowsアプリに取り組んでいます。このアプリには、フォームに表示される名前の動的リストが含まれています (ユーザーは特定の名前を追加または削除できます)。私がやりたいのは、db の各名前に対して、リストから別のランダムな名前を付けることです。唯一の条件は、名前ごとに異なる名前を割り当て、すべての名前を一度だけ使用する必要があることです。

私がやろうとしたことは、リストを使用してデータベースからの名前を含め、リストからランダムなインデックスを選択して、それをデータベース内の対応する場所と比較することです。異なる場合は、そのインデックスで削除し、配置する名前がなくなるまで繰り返します。

しかし、その後、それは完璧な方法ではないことに気付きました。たとえば、名前が 5 つあるとします。

name 1 はランダムに name 3 を取得します name 2 はランダムに name 1 を取得します name 3 はランダムに name 4 を取得します name 4 はランダムに name 2 を取得します... name 5 は name 5 しか取得できないため、この場合は機能しません。

どうすればそれを機能させることができるか、誰にも分かりますか?他にどのような方法を使用すればよいですか? 名前の数は約 20 です。後で、名前ごとに 2 つの異なる名前を割り当てる必要があります。しかし、まずこの問題を解決する必要があります。

どんな助けでも大歓迎です!C#で書いています

0 投票する
9 に答える
12166 参照

python - Pythonでカテゴリの加重ランダムサンプルを行う方法

各タプルが確率とアイテムで構成されるタプルのリストが与えられた場合、その確率に従ってアイテムをサンプリングしたいと思います。たとえば、リスト [ (.3, 'a'), (.4, 'b'), (.3, 'c')] を指定します。40% の確率で 'b' をサンプリングしたいと思います。

Pythonでこれを行う標準的な方法は何ですか?

適切な関数を持っていないように見えるランダムモジュールと、多項式関数を持っているが、この問題に対して適切な形式で結果を返さないように見える numpy.random を見てきました。私は基本的に、matlab で mnrnd のようなものを探しています。

どうもありがとう。

すべての回答を迅速にありがとうございます。明確にするために、私はサンプリングスキームの書き方の説明を探しているのではなく、一連のオブジェクトと重みが与えられた多項分布からサンプリングする簡単な方法を指摘するか、そのような関数が存在しないと言われたい.標準ライブラリにあるので、自分で書く必要があります。

0 投票する
3 に答える
3006 参照

r - 無作為抽出

複数回出現する可能性のある整数である真の乱数(量子ジェネレーターを使用して取得)の大規模なコレクションを使用して、Rのより大きなサンプル内でランダムなサブサンプルを取得する方法を実装する方法を知りたいです。

__

編集:解決策。

修正が必要で、float64 で生成された数値が最終的に一意になったので (精度が高いため)、次の解決策を使用しました。

1) length(data) と同じ数の数値を生成する

2)

3) データセットを分割する

0 投票する
2 に答える
189 参照

javascript - JavaScriptは範囲から数値をランダムに選択/返しますか?

重複の可能性:
Javascript/html: 数値 A と数値 B の間で乱数を生成する方法は?

ヘレンとメンシュ!

私は、次のことについてあなたに質問します: 情報を提供する Math.round() を使用して、範囲 (from -> to) の間の数値をランダムに返しますか?

これは、多くの Web ブラウザでサポートされている物議を醸している JavaScript スクリプト言語でどのように達成できるのでしょうか?

0 投票する
4 に答える
1698 参照

performance - 膨大なリストからの効率的なランダム サンプリング

多数の値 (53,000,000+) を含むデータ ファイルがあり、これらの値のn 個のランダムなサブセット(たとえば、2,000,000) を取り出したいと考えています。リストをメモリに取り込み、 Fisher-Yates メソッドを使用して配列をシャッフルし、シャッフルされたリストの最初のn 個の値を出力する Perl スクリプトを実装しました。ただし、このシャッフル プロセスは、はるかに小さなテスト セット (50,000 値) であっても、かなりの時間を要します。

膨大な値のセットのランダムなサブセットを識別して出力する、より効率的でスケーラブルな方法を探しています。助言がありますか?

更新:回答とさらに検索に基づいて、正しい用語は「ランダムサンプリング」のようです。

0 投票する
2 に答える
3862 参照

r - サンプルを使用して多項分布から巨大なサンプル (1e09) を抽出する

多項分布からサンプリングしたいと思います。サンプルを使用していくつかの確率を指定することでこれを行います。例: 3 つのカテゴリがあり、10 回サンプリングしたいと考えています。

私の設定は、次の点でのみ異なります: 多くの (1e09 など) の数値をサンプリングしたい。実際、私は各カテゴリの頻度にのみ関心があります。したがって、上記の例では、これは次のことを意味します。

これをできるだけ効率的に計算する方法を知っている人はいますか?

ありがとう、ステフィ