私は次のデータセットを持っています。数値は(異なるサイズの)間隔を参照しています:
Income Numerosity
from 6000 to 7500 704790
from 7500 to 10000 1294784
from 10000 to 12000 1051902
from 12000 to 15000 1585132
from 15000 to 20000 704012
from 20000 to 25000 206901
from 25000 to 30000 156661
次のように(近似)データセットを取得したいと思います。
Income Numerosity
6000 ...
7000 ...
8000 ...
... ...
30000 ...
この目的のために、次のことを試しました。最初にsample(6000:7500, 704790, replace=TRUE)
、各行に使用し、結果を連結して、生成されたrpop
観測のベクトルを作成しました。次に、関数を適用しました(分布を滑らかにするためdensity
に、パラメーターのさまざまな値を試しました)bw
d=density(rpop,bw=2000,from=6000,to=30000,n=25)
d$x
必要な収入レベルを与えますが、数値はに比例しますd$y
ただし、同じ結果を得るためのより良い (より直接的またはエレガントな) 方法があるのではないかと思います。