特定の変数に従ってサンプルを分割し、それぞれが変数の分布の四分位数に関連する4つのサブサンプルを作成したいと思います。目的は、この変数のさまざまなレベルの存在が回帰の結果に影響を与え、それが有意であるかどうかを示すことです。
MatBi
質問する
24417 次
2 に答える
6
これを行う最も簡単な方法は、egen
コマンドを使用して変数を4つの等間隔の間隔にカットすることです。
例:
. sysuse auto, clear
(1978 Automobile Data)
. sum price, detail
Price
-------------------------------------------------------------
Percentiles Smallest
1% 3291 3291
5% 3748 3299
10% 3895 3667 Obs 74
25% 4195 3748 Sum of Wgt. 74
50% 5006.5 Mean 6165.257
Largest Std. Dev. 2949.496
75% 6342 13466
90% 11385 13594 Variance 8699526
95% 13466 14500 Skewness 1.653434
99% 15906 15906 Kurtosis 4.819188
. egen price_cut = cut(price), group(4)
. table price_cut, contents(n price min price max price)
----------------------------------------------
price_cut | N(price) min(price) max(price)
----------+-----------------------------------
0 | 18 3,291 4,187
1 | 19 4,195 4,934
2 | 18 5,079 6,303
3 | 19 6,342 15,906
----------------------------------------------
これがお役に立てば幸いです。
于 2012-09-25T17:11:47.113 に答える
0
これが最も簡単な方法です。
xtile xx=yourvariable, nq(4)
これが役立つことを願っています。
于 2014-09-03T22:16:03.733 に答える