5

私はこのsurveyパッケージを使用してAmerican Community Surveyのマイクロデータを扱っており、ベーシックインカムの不平等統計を計算したいと考えています。私は私のデザインとして以下を設定しました:

testsurv <- svrepdesign(data=test, repweights = test[,8:87], weights = test$HHWT, 
                   combined.weights=TRUE, type = "Fay", rho = 0.5,scale=4/80, 
                   rscales = rep(1, 80), mse=TRUE)

そこから、年ごとのジニ係数と所得の分位数比を年ごとに計算したいと思います。分位数と関連するエラーの生成は、 and を使用して簡単に行うことができsvybyますsvyquantile

quants <- svyby(~INCOME, ~YEAR, testsurvey, svyquantile, 
              quantiles=c(0.9, 0.75, 0.5, 0.25, 0.1), keep.var=TRUE)

それは私の最初の質問に私をもたらします: 各分位点の反復重みベースの誤差がある場合、収入の分位数の比率 (たとえば 90/10) の標準誤差を計算するにはどうすればよいですか? 使用してみsvyratioましたが、それは変数全体の比率であり、変数内の選択された観測値ではありません。

2 番目の質問: fromsurveyのような既存の関数を使用して、ジニ係数 (レプリケート ベースのエラーを含む) を計算する方法はありますか? 使ってみたのですが、うまくいきませんでした。おそらく、引数を変数、次に重みとして並べているのですが、指示が逆の順序を指定しているためです。両方の方法を試しましたが、どちらもうまくいきませんでした。たとえば、HHWT はサンプルの重みです。ginireldistwithReplicatesginiwithReplicates

> withReplicates(testsurv, gini(~HHWT, ~INCOME))

これにより、次のエラー メッセージが表示されます。

Error in sum(weights) : invalid 'type' (language) of argument
In addition: Warning message:
In is.na(x) : is.na() applied to non-(list or vector) of type 'language'
4

1 に答える 1