これがこの質問を投稿するのに適切な場所ではない場合、私の謝罪は、R での統計計算の数値安定性に関連しています。
非常に高い値の df2 の F 値を計算しようとしていますが、数値的に不安定なようです。
nrange <- 350000:450000
f <- qf(1e-8, 8, nrange, lower.tail=FALSE)
plot(f ~ nrange)
次のようになります。
本質的にそのあたりdf2=400000
ではもはや正確ではありません。問題は、この問題を回避する方法を知っている人はいますか? たとえば、F 分布は 2 つのカイ 2 乗に近似することができ (例: http://en.wikipedia.org/wiki/F-distribution#Related_distributions_and_properties)、そのドキュメントでは、大きな d2 のqf
使用について何か述べています。qchisq
実際qchisq
にはこれらの値で正確に見えますが、これを実装する方法は明らかではありません。例えば
qf(0.05, 8, 100, lower.tail=FALSE)
と
(qchisq(0.05, 8, lower.tail=FALSE)/8) / (qchisq(0.05, 100, lower.tail=FALSE)/100)
同じ結果を出さないでください。
問題は、大きな df2 の正確な F 値を取得するにはどうすればよいかということです。どんな助けでも大歓迎です。ありがとう!