問題タブ [mgcv]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ggplot2 での「ガム」スムージングの問題
ggplot2 で GAM スムージングを使用しようとしています。この会話とこのコードによると、ggplot2 は、n >= 1000 の場合にのみ、一般的な加法的モデルに使用されるmgcvパッケージをロードします。それ以外の場合、ユーザーはパッケージを手動でロードする必要があります。私が理解している限り、会話からのこのサンプルコードは、次を使用して平滑化を行う必要がありますgeom_smooth(method="gam", formula = y ~ s(x, bs = "cs"))
。
しかし、私はエラーが発生します:
次のようにしようとすると、同じエラーが発生します。
しかし、たとえば線形モデルは機能します。
ここで何が間違っていますか?
R とパッケージのバージョンは最新である必要があります。
r - mgcv ソース コードのよくコメントされたバージョンを探す
相互投稿 (R ヘルプで) をお詫びしますが、SO はより多くのビューを取得します。知っている人がここで質問を見つけてくれることを願っています。
私が取り組んでいるプロジェクトの一部を変更できるように、mgcv を構成するさまざまな機能のよくコメントされたバージョンを探しています。特に探しているのは
- testStat
- 概要.gam
- リュー2
- シムフ
mgcv:::whatever と入力すると、これらを見つけることができます。しかし、ネストされたステートメントがたくさんあるため、理解するのif
が難しくなります。各ステップで何が起こっているかを正確に説明するコード内のコメントは、私の人生をずっと楽にしてくれます。
コードのより詳細なバージョンはどこにありますか? そのようなものは存在しますか?
編集: 削除されたコメントへの対応: 以前に使用したことがないため、github で見つかるとは知りませんでした。FFR、ここにあります: https://github.com/cran/mgcv
r - mgcv gam モデルに 2 つの滑らかな項の積を含めることは可能ですか?
私は、gam を使用して時系列データの季節性をモデル化することに大きな成功を収めました。私の最新のモデルは、季節的な変化に加えて、週ごとのパターンを明確に示しています。1 週間のパターン自体は 1 年を通して非常に安定していますが、その振幅は季節によっても異なります。したがって、理想的には、データを次のようにモデル化したいと考えています。
ここでf
、g
とh
は の循環平滑関数です。mgcv
残念ながら、これは機能せず、エラーがスローされますNA/NaN argument
。whichを使用してみte(day_in_year, day_in_week, k=c(52, 5), bs='cc')
ましたが、モデルが利用可能な年数が少ない特定の平日に当たる休日に過適合するため、自由度が多すぎます。
私がやろうとしている方法でモデルを指定することは可能ですか?
r - Smooth.splineの信頼区間を取得するには?
私はsmooth.spline
自分のデータの 3 次スプラインを推定するために使用しました。しかし、式を使用して 90% の点ごとの信頼区間を計算すると、結果が少しずれているように見えます。私が間違ったことをしたかどうか誰かに教えてもらえますか?関数に関連付けられたポイントごとの間隔バンドを自動的に計算できる関数があるかどうか疑問に思っていsmooth.spline
ます。
正しくやったかどうかわからないので、パッケージのgam()
関数を使用しました。mgcv
すぐに信頼区間が表示されましたが、それが 90% または 95% CI なのか、それ以外なのかはわかりません。誰かが説明できれば素晴らしいことです。
r - mgcv で使用されているメモリを再利用するにはどうすればよいですか?
R パッケージ mgcv を使用して多数の GAM フィットを実行すると、メモリが不足するという問題が発生しています。ライブラリをロードし、次のスクリプトを使用していくつかのランダム データを初期化します。
これは与える
次に、10 個の GAM を装着し、メモリ使用量を確認します
結果は
作成したオブジェクトは 1 つだけですが (適合)、メモリ使用量はこのオブジェクトのサイズの 3 倍であることに注意してください。より多くのモデルを適合させると、最終的に R はメモリを完全に使い果たします。私がやっていることは、ディスクに保存することです
次に、新しいセッションを開始してリロードします
そして出来上がり!記憶が戻った
ディスクに保存したり、新しいセッションを開始したり、ディスクからロードしたりすることなく、メモリを再利用する方法はありますか?
r - predict.gam と新しい因子水準
2 つのフィッティング ステップを含む種分布データのハードル タイプ分析を実行しています。最初のステップは、family=quasibinomial のすべてのデータを使用して (m1) の有無データをモデル化することです。2 番目のステップ (m2) は、family=Gamma のポジティブ プレゼンスのみのデータを使用することです。これは、完全なデータセットで 2 番目のモデル (m2) を使用して予測しようとすると、新しい因子レベルによるエラーが発生するまで、うまく機能します。このエラーが表示される理由を理解しました。完全なデータセットに表示され、reduce (存在のみ) データセットには存在しない因子レベルがあります。私の質問は、フルセットで 2 番目のモデルを使用して予測を取得できるように、このエラーを回避するにはどうすればよいですか? mgcvを使用しています。
編集:追加のコードとデータで更新されました。
2 番目のモデルを実行すると、次のエラーが表示されます。
r - R での特異精度行列の警告
私はこのフォームの別のモデルを実行しています:
R はエラーをスローしません (つまり、出力があります) が、次のような警告が表示されます。
- どういう意味ですか?
- それは問題ですか、それとも一緒に暮らすことができますか?