0

以前にも同様の質問があったことは承知していますが、私が必要としている正確な回答が見つかりませんでした。私が見逃している簡単な解決策のようです。

約 20,000 人の参加者のサンプルがあり、このサンプルから 2500 人を無作為に選択してギフトカードを受け取り、別の 2500 人 (最初のグループに属していない) を現金手当を受け取りたいと考えています。参加者は、決して繰り返したり、複製したりしないでください。参加者は一意の ID で識別されます。

参加者を表す各行のインデックスを作成します (このステップは回避できると思います)。

Npool=1:dim(pool_20K)[[1]]
giftcards=sample(Npool,2500)

-- 現金手当グループを作成して、ギフトカード用に選択された参加者を含まないようにするにはどうすればよいですか?

その後、インデックスとデータを組み合わせます

giftcards_ids=pool_20K[giftcards, ]

洞察はありますか?かなり単純な問題を複雑にしているように感じます。

よろしくお願いします!!

4

1 に答える 1

1

全体をシャッフルしてから、サブセットを選択します。

shuffled.indices = sample(nrow(pool_20K))

giftcards = shuffled.indices[1:2500]
cash = shuffled.indices[2501:5000]
于 2013-10-04T16:01:30.013 に答える