問題タブ [glm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - glm$residuals と resid(glm) について
glm$residualsとresid(glm)によって返されるものを教えてください。ここで、glm は準ポアソン オブジェクトです。たとえば、glm$y と glm$linear.predictors を使用してそれらを作成するにはどうすればよいでしょうか。
glm$残差
resid(グロム)
r - ggplot stat_smooth呼び出しの後に、モデル適合パラメーターを抽出できますか?
を使用してstat_smooth
、モデルをデータに適合させることができます。例えば
glm二項近似の係数を知りたいのですが。で近似をdlply
やり直して係数を取得することもできますが、ldply
そのような重複は避けたいと思います。
呼び出すstr(g)
と、作成するオブジェクトの階層が明らかになりますggplot2
。おそらく、それを介して係数に到達する方法はありますか?
r - 各共変量を明示的に宣言せずにglmを使用してRで式を指定する
それぞれを完全に指定せずに、特定の変数を glm 回帰に強制したいと思います。私の実際のデータセットには、約 200 個の変数があります。これまでのオンライン検索では、このサンプルを見つけることができませんでした。
例 (3 つの変数のみ):
すべての主要な用語を含めたい場合、これには簡単なショートカットがあります。
しかし、すべての主要な用語 (W1、W2、および A) と W2^2 を含めたいとします。
これにはショートカットがありますか?
[公開前に自分自身を編集:] これは機能します!glm(formula = Y ~ . + I(W2^2), family = binomial, data = samp)
さて、これはどうですか!
主要な用語変数を 1 つ省略し、2 つの主要な用語 (A、W2) と W2^2 および W2^2:A のみを含めたいと考えています。
明らかに、変数がわずかしかない場合は近道は必要ありませんが、私は高次元のデータを扱っています。現在のデータセットには 200 個の変数しかありませんが、他のいくつかの変数には何千もの変数があります。
python - Windows 7 64 の Python スクリプト内で GLM を実行する
Pythonスクリプト内(ループ内)でGLM(一般化線形モデル)を繰り返し実行しようとしています。
1- Scipy glm 関数内で Stats を使用しようとしましたが、説明がまったく存在せず、うまく使用できなかったと思います --> エラー メッセージ
tats.py ファイル内と _support.py 内を検索して、結果のない方法を見つけました。2-私はRPY2をインストールしようとしました(lgautierまたは他の人が私を読んでくれることを願っています)またはRを利用した機能を使用しています。しかし、私はWindows 7 64を使用しており、うまくインストールできなかったようです。エラーメッセージがあります:
Python で堅牢な GLM を実行する方法 (他の方法は? Windows 7 64 に RPY (初心者/基本的な学生学習者) をインストールし、Python とインターフェイスする方法は?
r - データフレームから多くの変数を含む式を簡潔に書く方法は?
応答変数と、3 つの共変量を含むデータがあるとします (おもちゃの例として)。
データに線形回帰を当てはめたい:
個々の共変量を書き出す必要がないように、式を書く方法はありますか? たとえば、次のようなもの
(データフレームの各変数を共変量にしたい。)データフレームに実際に50個の変数があるので、書き出すのを避けたいx1 + x2 + x3 + etc
.
r - R プログラミング: varfun を使用して glm ファミリ準で分散関数を指定する
varfun を使用して、glm の準ファミリで独自の分散関数を指定したいのですが、関数の使用方法に関するドキュメントが見つかりません。この機能の使い方を知っている人はいますか?
r - Rプロビット回帰の限界効果
私はRを使用して研究を再現し、著者が報告したのとほぼ同じ結果を得ています。しかし、ある時点で、非現実的に小さいように見える限界効果を計算します。私の推論と以下のコードを見て、私がどこかで間違っているかどうかを確認していただければ幸いです。
私のサンプルには24535個の観測値が含まれており、従属変数「x028bin」は値0と1をとるバイナリ変数であり、さらに10個の説明変数があります。これらの独立変数のうち9つには数値レベルがあり、独立変数「f025grouped」はさまざまな宗教宗派からなる要素です。
宗教宗派のダミーを含むプロビット回帰を実行してから、限界効果を計算したいと思います。そのためには、最初に欠落している値を削除し、従属変数と独立変数の間のクロスタブを使用して、小さいセルまたは0個のセルがないことを確認します。次に、正常に動作するプロビットモデルを実行すると、妥当な結果も得られます。
ただし、プロビット係数とスケールファクターからすべての変数を平均して限界効果を計算する場合、得られる限界効果は小さすぎます(例:2.6042e-78)。コードは次のようになります。
データセットが大きすぎるため、実際の例を提供できないことをお詫び申し上げます。コメントをいただければ幸いです。どうもありがとう。
一番、
トビアス
r - 一般化 R 二乗 (Naglekerkes R^2)
Rを使用してGLMのNaglekerkes一般化R二乗を計算する方法を知っている人はいますか? そして、それをカウントデータ回帰に使用する意味はありますか?
参考文献:
「この記事の一番下までスクロールしてください!」
r - キャレットトレインが大量のメモリを消費するのはなぜですか?
を使用してトレーニングするとglm
、すべてが機能し、メモリを使い果たすことさえありません。しかし、train(..., method='glm')
実行するとメモリが不足します。
これtrain
は、クロス検証の反復ごとに大量のデータを保存しているためですか (または trControl プロシージャが何であれ)? 私は見てtrainControl
いますが、これを防ぐ方法が見つかりません...ヒントはありますか?私が気にするのは、パフォーマンスの概要と、おそらく予測された応答だけです。
(glmのグリッドがないため、パラメーター調整グリッド検索の各反復からのデータの保存に関連していないことはわかっています。)
r - RZeroinflモデル
Rのいくつかの昆虫計数データに対してゼロ膨張負の二項GLMを実行しています。私の問題は、ゼロ膨張を維持するために、Rに種データを1つの積み重ねられた列として読み取らせる方法です。小計して、Abundanceというタイトルの単一行としてRにインポートすると、ゼロが失われ、モデルが機能しなくなります。すでに、私は次のことを試みました:
データを自分でスタックする(80列* 47行あります)ので、手動でスタックした後の3760行では、pscl
zeroinfl()
コマンドを使用したときにRがどれほど遅くなるか想像できます(私のコンピューターでは20分かかります!、それでも機能します)次の問題は空間相関に関するものです。独立性を侵害するために同じ媒体からサンプリングされた特定のサンプラー。モデルの要素としてミディアムを入れることはできますか?