私は、さまざまなプログラムへの学生の登録を調べる回帰モデルの開発を任されました。これは、登録数がポアソン分布によく従う、非常に優れたクリーンなデータ セットです。モデルを R に当てはめます (GLM と Zero Inflated Poisson の両方を使用します)。結果の残差は妥当に見えました。
ただし、その後、生徒の数を、生徒数/学校人口として計算される「率」に変更するように指示されました (各学校には独自の人口があります)。 . これは、プログラムの「登録率」と見なされます。
この「率」(学生/人口) はもはやポアソンではありませんが、確かに正規でもありません。そのため、適切な分布と、それを表す後続のモデルについて少し迷っています。
対数正規分布はこの比率パラメーターにうまく適合しているように見えますが、0 の値が多いため、実際には適合しません。
この新しいパラメーターの最適な分布形式と、R でモデル化する方法に関する提案はありますか?
ありがとう!