問題タブ [glm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Ubuntu での Cedergren データセットのダウンロード
Ubuntu で cedergren データ セットを使用した人はいますか。Ubuntu OS を使用しているため、ダウンロードに問題があります。基本的にロジスティック回帰に使用されます
http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html
glm func を使用して、このデータセットでどのように機能するかを確認します
どんな助けでも大歓迎です!!
r - カテゴリ応答変数を使用して R で「glm」を呼び出す
重複の可能性:
glm で「アルゴリズムが収束しませんでした」および「数値的に 0 または 1 に適合した確率」という警告が表示されるのはなぜですか?
y1
応答変数をカテゴリとして次のデータを使用して、glm を適合させようとしています。コードから次の警告メッセージが表示されます。
時々、それは私にエラーを与えます
データから、予測変数と応答変数の間に明確な関係があることが明らかです。
データポイントの数が少ないため、「収束しませんでした」というエラーですか?
glm
以下に示すように、応答変数を因子に変換しています。これは正常ですか?
/li>x1
andx2
値がある場合、どうすれば応答を知ることができますか ?
r - glm を実行すると、「性別」変数の末尾に value(M) が付きます
R で 'glm' を実行すると、'gender' 変数の末尾に M (男性) が付きます。それは特別な意味を持っていますか、それとも私のコードに何か問題がありますか
r - ロジスティック回帰からの予測の信頼区間
Rでは、predict.lmは線形回帰の結果に基づいて予測を計算し、これらの予測の信頼区間を計算することもできます。マニュアルによると、これらの間隔はフィッティングの誤差分散に基づいていますが、係数の誤差間隔には基づいていません。
一方、ロジスティック回帰とポアソン回帰に基づいて予測を計算するpredict.glmには、信頼区間のオプションがありません。そして、ポアソンとロジスティック回帰に意味のある洞察を提供するために、そのような信頼区間をどのように計算できるかを想像するのにも苦労しています。
そのような予測に信頼区間を提供することが意味のある場合はありますか?それらはどのように解釈できますか?そして、これらの場合の仮定は何ですか?
r - forループの複数のglm
私はRデータフレームを持っており、次のように非常に単純化されています。
id
私の主題として(実際には2つ以上あります)、=correct
正しくない(0)または正しい(1)としてコード化された応答、およびphases
識別と逆転(主題内要因)。
次の形式でロジスティック回帰を実行したい
後でおそらく追加の予測子を追加します。glm()
ただし、被験者ごとにデータ量が異なるため、被験者ごとに個別に実行し、後でグループ効果の係数をANOVAと比較したいと思います。これをforループで次の形式で実行したいと思います。
しかし、エラーメッセージを受け取り続けます
データを確認しましたが、1つのレベルのみを含む要素はありません。すべての被験者は少なくとも1つの間違った応答と1つの正しい応答を出し、すべてが差別と逆転に参加しました。特定のサブジェクトを指定すると、関数はループの外側で機能します。
r - パラメータのセットがベクトルとして貼り付けられたときに、glmモデルのRで真の残差逸脱度と自由度を取得する方法
2つのモデルをF比検定で比較するRの関数を使用する必要があるように、スクリプトを(pythonで、pypeRのR部分を使用して)作成しています。
モデルは次のようになります。
モデル1: Response ~ Predictor A + Predictor B + Predictor C.... + Predictor n
モデル2: Response ~ Predictor 1
一緒に予測子A+B+...n
が構成されてPredictor 1
いるので、ここでネストしても問題はありません(私を信じてください)。
Predictor A + Predictor B + Predictor C.... + Predictor n
作成した関数に渡すと、1つの変数として扱われていると思います(自由度はと同じであるためModel 2
)。おそらくこれは私が使用しているためですpaste()
か?とにかく、モデル1の予測子の実際の数は実行ごとに変化するため(関数として必要な理由です)、を使用する以外にこれに対応する方法がわかりませんpaste()
。
ここでは、ペーストが実際には問題にならない可能性があることに注意してください。問題があるのではないかと人々に知らせたかっただけです。
真の残差逸脱度と自由度を取得する方法についての提案はありますmodel 1
か?それはハックである可能性があります。たとえばlength(vector of predictors) - 1
、自由度を取得するために単純に減算していました。残差逸脱に対する同様のハックがどのようなものになるかはわかりません。
関数とインスタンス化の例を次に示します。
r - R における glmm の重要な相互作用に対する単純な効果テスト
glmm 出力に重要な相互作用があり、参照カテゴリ (別の相互作用) が何であるかを知っていますが、参照カテゴリとの重要な相互作用を対比するときに、どの変数が固定されているかを知る必要があります。
「単純効果テスト」(Tukey ではない) と呼ばれる事後テストを探しています。R と JMP の両方を使用している場合、JMP では同じテストを「テスト スライス」と呼びます。
どこでも調べましたが、単純な効果テストのコードが見つかりません。Rでこのテストを使用する方法を知っている人はいますか?
これは、私の glmm (負の二項分布を使用) の出力の例です。
私の参照カテゴリは「FoodCategoryOther:SeasonHFHL」です。たとえば、この出力から、「FoodCategoryFruit:SeasonLFLC」は参照カテゴリよりも大幅に肯定的であることがわかります。
ただし、これが「SeasonLFLC」中に「FoodCategoryFruit」が「FoodCategoryPlantMatter」よりも大幅に肯定的であるためか (たとえば)、「FoodCategoryFruit」が「SeasonLFLC」中に「FoodCategoryFruit」よりも大幅に肯定的であるためかどうかはわかりません。 「シーズンHFHL」。
単純な効果テストでは、変数の 1 つを修正しながら、もう 1 つの効果をテストします。これは、誰かが同様の/より良い/より適切なテストを私に通知できない限り、問題を解決するために必要なものです. ただし、Tukey さんには言わないでください。この事後テストでは、一方の変数の影響をテストしている間に、もう一方の変数を修正しないからです。
r - glm 適合のラップリストから p 値を抽出する
lapply を使用して、一度に 1 つの独立変数ごとに 1 つの従属変数に対して複数の glm 回帰を実行しています。今、私は特にPr(>|z|)
各独立変数の に興味があります。ただし、Pr(>|z|)
lapply のリストだけを使用して報告する方法がわかりません。
一度に 1 つのモデルを実行しているだけの場合:
coef(summary(fit))[,"Pr(>|z|)"]
または
(ここでsummary(fit)$coefficients[,4]
説明されているように) 動作しますが、同様のことを試みてもうまくいかないようです。アクセサー メソッドを使用して、またはモデルから直接呼び出して、p 値だけを取得できますか?lapply
lapply
glm
r - 負の二項式からの最初の差分ブートストラップ
ここの初心者。Y がイベント数、D が治療、X が対数オフセットであるカウント データに負の二項モデルを当てはめています。
D=1 と D=0 の最初の差の信頼区間をブートストラップしたいと思います。私はここまでやってきましたが、それが正しいアプローチであるかどうかはわかりません:
これは最初の違いをブートストラップする正しい方法ですか?