0

Rパッケージ「geepack」でGEEモデルを計算しようとしています。応答変数は比例し、(成功、失敗) としてコード化されます。説明変数は、Weight(cont)、Rank(cont)、ColonySize(cont)、Sex(factor) です。データ セットには、413 日間の研究期間にわたって同じ個人の行動測定が繰り返されたため、観察の一時的な非独立性が含まれています。この非独立性は、AnimalID と観測日 (Ndate) を指定する列に反映されます。データ セットはそれほど大きくなく、165 人の異なる個人に関する 1062 の観測値が含まれています。完全な調査期間は 413 日間です (つまり、Ndate の範囲: 1 ~ 413)。

gee1<-geeglm(wl~WeightScaled+Rank+ColonySize+Sex,
data=allsub, family=binomial, id=AnimalID, 
corstr="ar1")

上記のモデルは、問題なく、顕著な遅延もなく計算されます。ただし、観測値は調査期間にわたって規則的に分布していません (以下の Ndate の完全なベクトルを参照)。これは、モデルの出力が意味をなさないことを意味します。時間的自己相関を正しく説明するためにモデルに波引数を含めると、R が動かなくなるか、このモデルの計算に非常に時間がかかるように見えますが、実際にはそれほど時間はかからないはずです。R-Gui が「(応答なし)」を 1 時間以上表示し、小さな円 (Win7) が R がビジーであることを示します。タスク マネージャーによると、CPU 使用率はほとんどが 25 ~ 30% で、最大で 50% になることもあります。私の質問は次のとおりです。「波」を指定するときに間違いを犯しましたか Rがハングする原因となる関数ですか、それともこのプロセスが非常に集中的に計算されるのは正常ですか? (以下の変数 Ndate の抜粋を参照)

波の引数を含むモデル:

gee1<-geeglm(wl~Weight+Rank+ColonySize+Sex,
data=allsub, family=binomial, id=AnimalID, 
corstr="ar1", waves=Ndate)

2 番目の質問は、この GEE とその自己相関構造に関するより基本的なものです。モデルは、1 人の個人の繰り返し観測が通常 5 ~ 15 回ですが、その間の時間が大きく変化する (場合によっては数回しかない) この種の時間的自己相関を処理できますか?日、場合によっては 100 日以上)。教科書の例はすべて非常に異なって見えますが、原則は同じはずです。

どうもありがとう。

> allsub$Ndate
   [1] 169 169 169  43  43   5   5   5 267 267 267 267 162 162 162 162 162 256
  [19] 256 256 256 256 256 263 263 263 263 263 263 176 176 176 176 176 176 183
 [37] 183 183 183 183 183 190 190 190 190 190 190 190 196 196 196 196 196 196
 [55] 196 284 284 284 284 291 291 291 291 175 175 175 175 175 175 175 175 199
 [73] 199 199 199 199 199 199 186 186 186 186 186 186 189 189 189 189 189 189
 [91] 266 266 266 266 266 266 196 196 196 196 196 196 196 242 242 242 242 242
 [109] 242 207 207 207 207 207 210 210 210 210 210 245 245 245 245 245 245 302
 [127] 302 302 302 302 302 302 302 217 217 217 217 217 217 217 270 270 270 272
 [145] 272 272 291 291 291 220 220 220 220 220 220 220 238 238 238 238 238 238

 [757] 291 291 291 291 291 291 220 220 238 238 241 241 294 294 294 294 294 294
 [775] 303 303 303 263 263 263 263 263 263 263 263 263 263 316 316 309 304 304
 [793] 304 323 323  19  50  99  67  67  67  22  22  22  43  60 110 178 178 178
 [811]  33 115 115 115 115  96 116 116 116 116 116 116 116 116 116 116 116  26
 [829]  26 122 122 122 122 122 122 122 122 122  64  40  40  40  40  40  40  40
 [847]  40  40  58  58  58  58  58  58  58  58  58  58  71  71  75  85 127  78
 [865]  78  12  12  12  12  12  12  12  12  12  12  15 152 152 152 152 337 337
 [883] 337 337 337 337 344 344 344 344 344 344 344  82  82  82  82  82  82  82
 [901]  82  82 348 348 348 348 348 348 348 348 348 351 351 351 359 359 355 355
 [919] 355 354 354 345 345 345 358 358 358 358 362 362 362 331 331 349 349 361
 [937] 361 378 364 364 364 369 369 369 375 375 375 373 373 373 373 342 365 365
 [955] 365 365 365 365 365 365 379 379 379 379 379 379 379 379 379 379 379 379
 [973] 379 379 352 352 341 382 382 382 385 373 373 373 373 373 373 368 368 368
 [991] 389 389 389 389 285 285 285 308 308 309 309 321 322 326 329 329 329 329
 [1009] 330 330 330 330 385 385 385 385 385 385 385 380 380 380 380 380 380 380
 [1027] 386 386 386 386 390 390 390 390 365 365 393 393 393 393 393 393 393   393

[1045] 393 393 393 393 393 393 399 397 397 397 392 392 392 392 407 407 400 400 [1063] 413 413

4

1 に答える 1

2

波の引数を含めるとRがクラッシュする理由がわかりました。GEEglm は、同じ日に行われた同じ個人の 2 つの観測を受け入れません。これは、モデルが何をするかを考えると理にかなっています。これが他の誰かを助けることを願っています。

于 2015-02-02T01:35:21.390 に答える