問題タブ [random-sample]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - ランダムな間隔でタイマーを使用する
以下のコードを使用して、ランダムな間隔でタイマーを実行しようとしています。問題は、これを行うと、1つの乱数しか投稿されず、コードで次の乱数を取得する方法がわからないことです。
c++ - ランダムにブースト::discrete_distribution構築されたウェイトを変更するにはどうすればよいですか?
OK、boost :: random::discrete_distributionで重み/確率を与えることは可能です。
例えば
二重確率[]={0.5、0.1、0.1、0.1、0.1、0.1};
boost :: random :: discrete_distribution <> dist(確率);
質問:オブジェクトdistが構築されたら
(1)重みの1つを0.5から0.3に変更するにはどうすればよいですか?
(2)すべての重みを一度に再割り当てするにはどうすればよいですか?
algorithm - 更新を許可しながら、分布からランダムサンプリングするための効率的なアルゴリズム?
これは私がインタビューで少し前に尋ねられた質問です、私は答えを見つけることができませんでした。
いくつかのサンプルS1、S2、... Snとそれらの確率分布(または重み、それが呼ばれるものは何でも)P1、P2、.. Pnが与えられると、その確率を考慮してサンプルをランダムに選択する設計アルゴリズム。私が持ってきた解決策は次のとおりです。
重みCiの累積配列を作成します。
C0 = 0; Ci = C [i-1]+Pi。
同時に、T = P1 + P2 +...Pnを計算します。O(n)時間かかります
- 一様に乱数を生成するR=T * random [0..1]
- 二分探索アルゴリズムを使用して、Ci>=Rのような最小のiを返します。結果はSiです。O(logN)時間がかかります。
ここで、実際の質問は次のとおりです。初期の重みPjの1つを変更したいとします。O(n)時間よりも良い時間でこれを行う方法は?他のデータ構造も受け入れられますが、ランダムサンプリングアルゴリズムはO(logN)より悪くなることはありません。
r - 無作為抽出 - 行列
1 と 0 が入力された行列から n 個のランダムな点のサンプルを取得するにはどうすればよいですか?
N 個のサンプルを取得した位置 (行、列) がランダムであることを確認したいと思います。
私が知ってsample {base}
いる他の方法は、x、yを追加して空間オブジェクトに変更し、再び通常の行列に戻すことを強制する空間方法です。
詳しくは
ランダムとは、「マトリックス空間」内にも広がることを意味します。たとえば、結果として4つの隣接ポイントを持ちたくない4つのポイントのサンプリングを行う場合、それらを「マトリックス空間」に広げます。
ランダムなポイントを取り出したマトリックス内の位置 (行、列) を知ることも重要です。
neo4j - Gremlin を使用して Neo4j からランダム サンプルを取得するにはどうすればよいですか?
Gremlin を使用して、Neo4j からノードのランダム サンプルを抽出しようとしています。いろいろと調べてみたところ、適切な方法が見つかりませんでした。
REST API 経由で Neo4j を使用します。
私の理想的なクエリは次のようなものです。
明らかに、そのような方法はありません。周りを検索すると、ランダム ノードのみを出力する .random() が見つかりました。私はこのようなことを考えました:
目標は、ほぼ同じサイズのランダムなセットを取得することでしたが、いくつかの結果が得られました。呼び出しスクリプトから、それをシャッフルして最初の 50 を選択します。ただし、結果セットがカウント後に空であるため、これも機能しません。
固定比率を取得してサブセットを取得することも検討しましたが、シャッフルがないと、最後のノードが取得される可能性が低くなり、必要以上のデータを送信することは避けたいと考えています。
結果セットを 2 回入力することもできます。1 回はカウント用、もう 1 回はフィルタリング用です。しかし、それは正しくないようです。
ランダムなサンプルを取得する良い方法は何ですか?
編集: (Marko A. Rodriguez のコメントに基づく
私は次のことを思いつきました:
最後の条件は少し面倒ですが、エントリが少ないとスライスは失敗します。
また、これは Neo4j のより大きなデータセットに影響を与えますか? ネットワーク通信に関しては、最適です。
matlab - MATLAB で非常に大きな配列からインデックスによって重み付けされた n 個の要素を選択する
非常に大きな正方行列 M(i, j) があり、行列の各要素が加重ランダム選択で要素が選択される確率を表すとします。行列から n 個の要素を ((i, j) インデックスで) 置換してサンプリングする必要があります。重みは、メイン ループの反復ごとに変更されます。
現在、私は次のようなものを使用しています:
しかし、これはかなり不格好な方法のようで、for ループのために非常に長い時間がかかります。より効率的な方法はありますか?おそらく、何らかの方法で行列をベクトル化したら?
*編集統計ツールボックスへのアクセス権がないことに言及する必要があります
よろしくお願いします。
python - 無作為標本から書き出す
ファイルに書き込むリストから 30 n のランダム サンプルがあります。
最後に「in_sample」または「not_in_sample」を記述して、サンプルに移動した行にタグを付けたいと思います。
次のようになります。
サンプルから行を書き出すだけですが、ファイルは次のようになります。
ファイルは以前と同じように見えましたが、最後の列がありませんでした。
私の言いたいことが分かりますか?
r - R で状態別に層別サンプルを作成する方法
「サンプリング」パッケージを使用してRで層化サンプルを作成するにはどうすればよいですか? 私のデータセットには 355,000 の観測があります。コードは最後の行まで正常に機能します。以下は私が書いたコードですが、常に次のメッセージが表示されます。
Stackoverflow の古いメッセージを参照しないでください。私はそれらを調査しましたが、使用できませんでした。ありがとうございました。
r - ブートストラップ分析用のシミュレートされたデータセット
私の目標は、ブートストラップ (1000 担当者) を使用して、600 の一意の個人 (ID) のデータセットから生成された 20 の刺激されたランダム ペアで特性 (x) に相関する r (ピアソンの相関係数) の帰無分布、平均、および CI を計算することです。最近、「proc surveyselect」を使用してデータセットを生成する SAS から R に切り替えました。質問:
- これらの結果を生成する最も効率的な方法は何ですか (以下の私の試みを参照)。
- 私の例では、set.seed コマンドを使用して結果を複製するにはどうすればよいでしょうか?
600 人の個体と関連する特性値を含むシミュレートされた開始データセット:
次に、r の 1000 回の複製を生成し、95% CI を計算します。
sql - SQL でランダムなサブセットを選択する (Sybase Server IQ)
rand() または newid() を使用してレコードのランダムなサブセットを選択しようとしていますが、次を実行するたびに、常に同じ結果が返されます。
これのすべてのバリエーションを試しましたが、上記のようにすると、sybase サーバー iq は常に同じ rand() 値を返すようです。やろうとすると
order by で newid() を使用するのは違法であるというエラーが表示されます。
助言がありますか?