データセットの分布を調べるために「sm」パッケージを使用しています。興味のある人のために、私は年齢の関数としての採用慣行を見て、グループの年齢分布の変化が性別や教育などの属性によって変化するかどうかを特定しようとしています.
SM パッケージは私にとって新しい経験であり、帰無仮説が真である場合 (両方の密度プロットが同じ分布から取得されたランダム サンプルによって生成される場合)、データセットを生成する可能性が最も高い密度関数を記述する関数を見つけようとしています。画像を投稿するのに必要な評判はありませんが、Imgur でこれも sm.density.compare で生成されたものを見つけました。
画像に表示されているのは、2 つのカーネル密度プロットとティール領域です。2 つの線が同じ分布からのデータによって生成された場合、真の密度プロットを含む 95% の可能性を含む参照バンドであると私は理解しています。
私が知りたいのは、x 軸の各値のリファレンス バンド内の最も可能性の高いポイントを通過するベクトルを計算する方法です。ルールに従って、私はもちろん、私が狂っている、または別のパッケージを使用する必要があるという提案を受け入れます。