1

私は次のデータセットを持っています。数値は(異なるサイズの)間隔を参照しています:

Income              Numerosity
from 6000 to 7500       704790
from 7500 to 10000     1294784
from 10000 to 12000    1051902
from 12000 to 15000    1585132
from 15000 to 20000     704012
from 20000 to 25000     206901
from 25000 to 30000     156661

次のように(近似)データセットを取得したいと思います。

Income  Numerosity
6000           ...
7000           ... 
8000           ...
...            ...
30000          ...

この目的のために、次のことを試しました。最初にsample(6000:7500, 704790, replace=TRUE)、各行に使用し、結果を連結して、生成されたrpop観測のベクトルを作成しました。次に、関数を適用しました(分布を滑らかにするためdensityに、パラメーターのさまざまな値を試しました)bw

d=density(rpop,bw=2000,from=6000,to=30000,n=25)

d$x必要な収入レベルを与えますが、数値はに比例しますd$y

ただし、同じ結果を得るためのより良い (より直接的またはエレガントな) 方法があるのではないかと思います。

4

1 に答える 1