個人をそれに応じてグループ化するために、マルチモーダル生物学的測定データに混合分布を当てはめました(長さ測定のマルチモーダルヒストグラムを描きます。各モードが異なる年齢コホートを表すと仮定すると、簡単に測定された長さデータから年齢の数字を推測できます) .
混合分布は、各モードへの各個人のメンバーシップの事後確率を提供するため、長さクラスによってビニングされると、1 行のデータは次のようになります。
l.class freq age1 age2 age3 age5
9 41 0.2 0.25 0.3 0.25
ここで、l.class は長さビン、freq は個体数、age1、age2、age3、age5 は特定の混合モード/年齢グループとの関連確率です。これらは比率ではなく確率であるため、各長さビンの年齢での数値の推定値を取得するために、各エントリを何度も反復したいと考えました。
Rでこれを達成するために使用しようとしsample()
ましたが、確率に応じていくつかの潜在的なグループの1つに分類することができません。