問題タブ [gam]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - mgcv gam モデルに 2 つの滑らかな項の積を含めることは可能ですか?
私は、gam を使用して時系列データの季節性をモデル化することに大きな成功を収めました。私の最新のモデルは、季節的な変化に加えて、週ごとのパターンを明確に示しています。1 週間のパターン自体は 1 年を通して非常に安定していますが、その振幅は季節によっても異なります。したがって、理想的には、データを次のようにモデル化したいと考えています。
ここでf、gとhは の循環平滑関数です。mgcv
残念ながら、これは機能せず、エラーがスローされますNA/NaN argument。whichを使用してみte(day_in_year, day_in_week, k=c(52, 5), bs='cc')ましたが、モデルが利用可能な年数が少ない特定の平日に当たる休日に過適合するため、自由度が多すぎます。
私がやろうとしている方法でモデルを指定することは可能ですか?
r - 格子モデルのプロット結果
パッケージgamから使用しているモデルをフィッティングしています。mgcv結果を に保存しています。modelこれまでのところ、 を使用して滑らかなコンポーネントを見てきましたplot(model)。私は最近使い始めlattice、その出力が気に入っています。を使用してこれらのグラフをプロットすることは可能latticeですか?
この私のデータセット: https://gist.github.com/plxsas/fcef4a228c18c772b4f3
latticeこのモデルを、私の 3 つのサイトをよりスムーズに表す 3 つのパネルを含むパッケージでプロットするにはどうすればよいですか?
dayinyearまた、適切な月の形式 (データの最初の列)の代わりに を使用していることにお気付きかもしれません。これは、一般化加法モデルがカテゴリ変数を処理しないためです。ただし、グラフの時間を月の名前で表現したいと思います(最初の列のように)。latticeプロットでそれを進める方法を知っている人はいますか?
r - mgcv::gam を使用して補間および「予測」する方法は?
スプラインを使用して 1 次元関数を補間する方法を習得することから始めました。
その後、使用できました
ポイント0の関数値を予測します。
次に、インターネットを検索して 3 次元データをスプライン化するものを見つけたところ、stackoverflow でmgcv::gamが最良の選択であることを示唆する回答に出会いました。
そして、私は試しました:
そして、私はしました:
ポイント(0,0,0)のスプライン補間の値を返すことを期待しています。しばらく計算すると、理解できない多次元データがたくさん返ってきました。
私は何か間違ったことをしているに違いない。gam オブジェクトから 1 つのポイントの値を受け取るにはどうすればよいですか? そして、念のため、gam が 3D データのスプラインを補間するための正しい選択であることに同意できますか、または同意できませんか?
再現可能な例を追加しています。
これはデータファイルです (c:/r/ で解凍してください) https://www.sendspace.com/file/b4mazl
最小限の再現可能な例:
predict(bdg, newdata=data.frame(0,0,0,0), type="response") の場合
newdata に十分なデータがないことを警告する多くの数値を返します
為に
何も返さず、同じことについて警告します。
r - mgcv で使用されているメモリを再利用するにはどうすればよいですか?
R パッケージ mgcv を使用して多数の GAM フィットを実行すると、メモリが不足するという問題が発生しています。ライブラリをロードし、次のスクリプトを使用していくつかのランダム データを初期化します。
これは与える
次に、10 個の GAM を装着し、メモリ使用量を確認します
結果は
作成したオブジェクトは 1 つだけですが (適合)、メモリ使用量はこのオブジェクトのサイズの 3 倍であることに注意してください。より多くのモデルを適合させると、最終的に R はメモリを完全に使い果たします。私がやっていることは、ディスクに保存することです
次に、新しいセッションを開始してリロードします
そして出来上がり!記憶が戻った
ディスクに保存したり、新しいセッションを開始したり、ディスクからロードしたりすることなく、メモリを再利用する方法はありますか?
r - for ループまたは lapply を使用して複数の GAMM モデルを実行する
誰かが for ループまたはラップリーで複数の GAMM モデルを実行するのを手伝ってくれませんか: 列に配置された大きなデータ フレームに 10 個の応答変数と 20 個の予測変数のセットがあります。
予測子と応答の組み合わせごとに GAMM モデルを適用し、それらの係数と有意性検定を表にまとめたいと思います。
models<-gamm(AnimalCount ~ s(気温), data=dat,family=poisson(link=log) , random=list(Province=~1) )
r - Rを使用した重回帰は負の予測を予測しています
Rで多重回帰-GAMを使用して予測を予測する際に問題があります。目的は、さまざまな独立変数とダミー変数を使用して従属変数の予測を予測することであり、テストデータとトレーニングデータに分割している約2年以上のデータがあります. しかし、従属変数を予測している間、それはマイナスで予測します。これは間違っています。従属変数と独立変数の両方の入力として与えられたデータは、負の値を持ちません。従属変数 (予測される) は、通常、ほとんどが 0 から 25 の間の小さな値です。因子として使用される独立変数は、0 から 20 と低いものはほとんどなく、数百万単位のものはほとんどありません。
誰かがこれについて私を助けることができますか? 何が問題で、どうすれば修正できますか? 前もって感謝します。
@Oliver - 私が使用しているコード:
r - mgcv を使用した予測誤差の k 分割交差検証
5 分割交差検証を使用して新しいデータを予測する際の GAM のパフォーマンスを評価したいと思います。モデルのトレーニングは、データの 80% のランダムなサブセットと残りの 20% のテスト セットに基づいています。トレーニング データとテスト データの間の平均二乗予測誤差を計算できますが、これを k 分割で実装する方法がわかりません。トレーニング データセットとテスト データセット、および MSPE を計算するための次のコードがあります。サンプル データは含めていませんが、含めることはできます。