0

データセットの分布を調べるために「sm」パッケージを使用しています。興味のある人のために、私は年齢の関数としての採用慣行を見て、グループの年齢分布の変化が性別や教育などの属性によって変化するかどうかを特定しようとしています.

SM パッケージは私にとって新しい経験であり、帰無仮説が真である場合 (両方の密度プロットが同じ分布から取得されたランダム サンプルによって生成される場合)、データセットを生成する可能性が最も高い密度関数を記述する関数を見つけようとしています。画像を投稿するのに必要な評判はありませんが、Imgur でこれも sm.density.compare で生成されたものを見つけました。

ここに画像の説明を入力

画像に表示されているのは、2 つのカーネル密度プロットとティール領域です。2 つの線が同じ分布からのデータによって生成された場合、真の密度プロットを含む 95% の可能性を含む参照バンドであると私は理解しています。

私が知りたいのは、x 軸の各値のリファレンス バンド内の最も可能性の高いポイントを通過するベクトルを計算する方法です。ルールに従って、私はもちろん、私が狂っている、または別のパッケージを使用する必要があるという提案を受け入れます。

4

1 に答える 1

0

どうやら、Rstudio または R のいずれかにバグがあり、最も明白な方法で問題を解決できなかったようです。R sm.density.compare の他のすべてがオブジェクトを生成するため、保存しようとすると失敗しました。

最初にオブジェクトをプロットしたとき (sm.density.compare が実行されたときのデフォルトの動作)、同じことを行っただけでなく、新しいオブジェクトを作成したとき、問題は自動的に解消されました。

そう:

sm.density.compare(a, b, model="equal", xlab=Year of Birth")
DensityObject = sm.density.compare(a, b, model="equal", xlab=Year of Birth")

そして、実際の行は次のように計算できます。

DensityObject$average = rowMeans(cbind(DensityObject$upper, DensityObject$lower), na.rm=TRUE)
于 2014-08-09T10:31:15.747 に答える