r - 3つ以上のパラメトリック予測子または同様の効果へのトリックを備えたRの黄土の実装はありますか?

Question

ローカル回帰および/またはRですべての専門家を呼び出す!

Rの標準黄土関数の制限に遭遇しました。アドバイスをいただければ幸いです。現在の実装では、1 ～ 4 個の予測子のみがサポートされています。グローバルフィットパラメトリック共変数を採用するとすぐに、これが簡単に問題になる理由を示すために、アプリケーションシナリオを設定しましょう。

基本的に、空間歪みs(x,y)が多数の測定値zに重ね合わされています。

z_i = s(x_i,y_i) + v_{g_i}

これらの測定値zは、各グループgの同じ基礎となる歪みのない測定値vによってグループ化できます。グループメンバーシップ g_i は測定ごとにわかっていますが、基になるグループの歪みのない測定値 v_g はわかっていないため、(ローカルではなくグローバル) 回帰によって決定する必要があります。

2 次元の空間トレンドs(x,y)を推定する必要があり、これを削除します。私たちのアプリケーションでは、最も単純なシナリオで、それぞれ少なくとも 35 の測定値を持つ 20 のグループがあるとします。測定値はランダムに配置されます。最初のグループを参照すると、19 個の未知のオフセットがあります。

以下のおもちゃデータのコード (1 次元xに空間傾向がある) は、2 つまたは 3 つのオフセットグループに対して機能します。

残念ながら、4 つ以上のオフセットグループに対して黄土呼び出しが失敗し、エラーメッセージが表示されます。

Error in simpleLoess(y, x, w, span, degree, parametric, drop.square,
normalize,  :
  only 1-4 predictors are allowed"

制限をオーバーライドしようとしましたが、

k>d2MAX in ehg136.  Need to recompile with increased dimensions.

それはどれほど簡単でしょうか？どこにもd2MAXの定義が見つかりません。これはハードコーディングされている可能性があります。

if(k .gt. 15)   call ehg182(105)

あるいは、ここで適用できるグローバル (パラメトリック) オフセットグループを使用したローカル回帰の実装を知っている人はいますか?

または、これに対処するより良い方法はありますか？私は相関構造でlmeを試しましたが、それははるかに遅いようです。

どんなコメントでも大歓迎です！

どうもありがとう、
デビッド

###
#
# loess with parametric offsets - toy data demo
#

x<-seq(0,9,.1);
x.N<-length(x);

o<-c(0.4,-0.8,1.2#,-0.2  # works for three but not four
     );  # these are the (unknown) offsets
o.N<-length(o);
f<-sapply(seq(o.N),
          function(n){
            ifelse((seq(x.N)<= n   *x.N/(o.N+1) &
                    seq(x.N)> (n-1)*x.N/(o.N+1)),
                    1,0);
          });
f<-f[sample(NROW(f)),];

y<-sin(x)+rnorm(length(x),0,.1)+f%*%o;
s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')});
s<-paste(c('y~x',s.fs),collapse='+');
d<-data.frame(x,y,f)
names(d)<-c('x','y',s.fs);

l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d,
         span=0.4);
yp<-predict(l,newdata=d);
plot(x,y,pch='+',ylim=c(-3,3),col='red');  # input data
points(x,yp,pch='o',col='blue');           # fit of that

d0<-d; d0$f1<-d0$f2<-d0$f3<-0;
yp0<-predict(l,newdata=d0);
points(x,y-f%*%o);     # spatial distortion
lines(x,yp0,pch='+');  # estimate of that

op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]});

cat("Demo offsets:",o,"\n");
cat("Estimated offsets:",format(op,digits=1),"\n");

score 5 · Accepted Answer

これに加算モデルを使用しないのはなぜですか? あなたの質問を理解すれば、パッケージmgcvはこの種のモデルを処理します。私はこれが間違っているかもしれませんが、あなたが示すコードは x ~ y に関連していますが、あなたの質問は z ~ s(x, y) + g に言及しています。以下に示すのは、空間平滑化によってモデル化され、パラメトリックに推定され、データフレームに係数として格納されたgam()応答です。zxygg

require(mgcv)
m <- gam(z ~ s(x,y) + g, data = foo)

または、あなたが望んでいたことを誤解しましたか？データの小さなスニペットを投稿したい場合は、mgcvを使用して適切な例を挙げることができます...?

r - 3つ以上のパラメトリック予測子または同様の効果へのトリックを備えたRの黄土の実装はありますか?

1 に答える 1

Related

Reference