Rの調査データを使用してBox-Cox多変量変換を推定する方法を知っている人はいますか?層とクラスター(私が使用しているデータ)を考慮に入れているものは何も知りませんが、確率の重みを考慮に入れているものでも素晴らしいでしょう。確率の重みが適用されると、1つ以上の変数が変化する可能性があるため、変換が根本的に変化する可能性があります。エラーやBox-Coxアルゴリズムなどにも影響がある可能性がありますが、これは基本的に理論確認アプローチを超えています。
更新された質問
R関数powerTransform
はうまく機能しますが、調査データについてはまだ何もないと思います。Stataはこれを処理できると思いましたが、Nickが指摘したように、そうではありません。サンプリングの重みを処理する唯一のBox-Cox変換はこれのようです。
単変量と多変量の両方のBoxCox変換を確率加重データに適用できるR関数を知っていますか?
私はデータを持っていませんが、誰かがこれに対する解決策を見つけたかどうか疑問に思っていました。特定の例が与えられたときに人々が感謝することを私は知っています...
単変量Box-Cox: lmおよびsvyglm(調査パッケージ)オブジェクトを使用すると、単変量Box-Coxの結果が返されます。
library(survey)
data(api)
library(car)
dstrat<-svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
Sur<-svyglm(api00~mobility, design=dstrat)
NotSur<-lm(api00~mobility, data=apistrat)
powerTransform(Sur)
powerTransform(NotSur)
ただし、実行するとNotSurと同じ(そしてSurとは異なる)結果が得られるため、調査オブジェクトを使用したpowerTransformationは正しくないと思います。
None<-svydesign(id=~1, weights=rep(1,nrow(apistrat)), data=apistrat, )
Sur2<-svyglm(api00~mobility, design=None)
powerTransform(Sur2)
実際のデータを使用する必要があるため、多変量正規性をどのように見つけるかについては、さらに確信が持てません。
summary(powerTransform(cbind(api00,mobility)~1,apistrat))