R は比較的新しいので、無知であることをあらかじめお詫びします。
私は、長年にわたって、全国の複数のサイトで観測のいくつかの (非常に大きな) データセットを扱っています。x週に観察を提出したサイトの総数のうち、x週に特定の種に注目したサイトの割合を計算する必要があります(本質的に存在/不在データ)。各個人の詳細を示す1つのデータセットがあります種の観察、および毎週の観察の総数の別のもの。そのため、その週に種が記録されたサイトの数をカウントし、それを同じ週に種の観察を記録したサイトの総数で割る関数が必要です。観測は、週 (1 ~ 53) と年 (1995 ~ 2011) で記録されます。
species.data の例 (貼り付けを簡単にするために csv としてリストされています):
SITE_ID, SPECIES, WEEKNO, YEAR
1289, Attenb., 1, 1995
1538, Attenb., 1, 1995
1894, Attenb., 2, 1995
1286, Attenb., 4, 1995
1238, Attenb., 7, 1995
1892, Attenb., 7, 1995
そして、total.obs.data の例:
YEAR, WEEKNO, TOTALOBS,
1995, 1, 100
1995, 2, 780
1995, 3, 100
1995, 4, 189
1995, 5, 382
1995, 6, 100
1995, 7, 899
1995, 8, 129
(したがって、ここでは、1995 年の第 1 週の比率が 2/100 であり、GLM または GAM のいずれかを構築できるとは考えていません)