私のデータは縦断的です。
VISIT ID VAR1
1 001 ...
1 002 ...
1 003 ...
1 004 ...
...
2 001 ...
2 002 ...
2 003 ...
2 004 ...
私たちの最終目標は、訪問ごとに 10% を選択してテストを実行することです。proc SURVEYSELECT を使用して、置換なしで SRS を実行し、「VISIT」を階層として使用しようとしました。しかし、最終的なサンプルでは ID が重複していました。たとえば、ID=001 は VISIT=1 と VISIT=2 の両方で選択される場合があります。
SURVEYSELECT または他の手順を使用してそれを行う方法はありますか (R も問題ありません)。どうもありがとう。