問題タブ [lm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 1 つまたは複数の係数を特定の整数に設定する
標準の lm モデルを使用しており、1 つ以上の変数の係数を特定の整数に設定したいと考えています。
たとえば、天気変数と価格変数の係数をそれぞれ 647 と 15 にしたいとします。
標準式で lm 関数を使用しています。
これまでに見つけた最も近いものは、glm 内のオフセット関数、または systemfit 内の restrict.rhs です。
また、係数セットを使用してこれらの変数から総寄与を差し引くことも検討しましたが、これはあまりスケーラブルではありません。
係数の設定に関するすべての問題を認識していますが、探索的な観点からのみ行いたいと思います。
r - 特定の範囲R内にフィットした線をプロットします
Rを使用して、2つの変数間の線形関係をプロットしたいのですが、近似直線がデータの範囲内にのみ存在するようにしたいと思います。
たとえば、次のコードがある場合、1:10のx値とy値からのみ線が存在するようにします(デフォルトのパラメーターでは、この線はデータポイントの範囲を超えています)。
r - 行列の乗算が係数に対して正常に機能しているのに、なぜlmのメモリが不足するのですか?
Rで固定効果線形回帰を実行しようとしています。私のデータは次のようになります。
次にyr
、ファクターを作成して使用することで、これを行うことにしましたlm
。
ただし、これはメモリが不足しているようです。私のファクターには20のレベルがあり、df
保存に約2GBかかる1400万行です。これは、このプロセス専用の22GBのマシンで実行しています。
次に、昔ながらの方法で試してみることにしました。次のようにして、各年のダミー変数を作成しt1
ますt20
。
単純に計算します。
これは問題なく実行され、ほぼすぐに答えが得られます。
係数をうまく計算できるときにメモリが不足するのは、lmについて特に興味がありますか?ありがとう。
r - Rのlm関数の詳細
RIの場合は、次の行を使用します。
Rは、原点を通過する回帰直線を見つけます。
私の質問は、原点はx = 0ですか、それともx値の最小値ですか?
たとえば、私のx値が1998年から2011年の場合、近似直線は1998年または0年までに通過しますか?
r - 回帰分析またはAnova?
できる限り明確になりたいと思っています。10 個の変数を持つデータセットがあるとします。そのうちの 4 個は、私が Y と呼ぶ特定の現象を表しています。残りの 6 個は、私が X と呼ぶ別の現象を表しています。
これらの変数 (10) のそれぞれには、37 単位が含まれています。これらの単位は、私の分析 (調査) の回答者にすぎません。すべての質問はリッカート尺度に基づいているため、質的変数です。スケールはすべて0から7までですが、「-1」と「-2」の値が抜けているものがあります。したがって、スケールは実際には -2 から 7 になります。
私がやりたいことは、私の Y (この場合は 4 つの変数と各変数に 37 の回答を含む) と私の X (代わりに 6 つの変数と同じ数の回答者を含む) の間の回帰を計算することです。定性的分析では、回帰の代わりにAnovaを使用する必要があることを知っていますが、回帰を行うことさえ可能であることをどこかで読んだことがあります。
今まで私はこのように行動しようとしました:
しかし、ご覧のとおり、Y を 4 つの変数で構成し、X を 6 で構成したものを使用しておらず、負の値も考慮していませんが、R^2 として非常に低いスコアを取得しています。
代わりに anova を使用すると、次の問題が発生します。
正直なところ、数日前にanovaの使用に成功しましたが、残念ながら方法を覚えておらず、コマンドをどこにも保存していませんでした。
私が知りたいのは:
- まず第一に、問題へのアプローチ方法が間違っていますか?
- 回帰出力についてどう思いますか?
- 最後に、アノバを作成するにはどうすればよいですか? 私がしなければならない場合。
r - コントラストタイプを変更すると、R lmサマリーの行ラベルが変更されるのはなぜですか?
R(contr.treatment)のデフォルトの対比では、線形モデルオブジェクトの要約は、レベル名に従って行名を示します。コントラストをcontr.sumに変更すると、線形モデルオブジェクトの要約は、構成された数値に従って行名を示します。
以下のサンプルコードの場合、処理コントラストの行名はxa xb xc xd xeであり、合計コントラストの場合はx1 x2 x3x4x5です。
行の名前を手動で変更する以外に、これらを同じように動作させる方法はありますか?
例:
java - R-lmとrの2乗
私はこのサイトや他のサイトで質問を実行してきましたが、これが正しく行われていることを理解していることを確認したいので、結果を分析するためのアドバイスが必要です。
am by nのバイナリ行列をJavaからRに(jriを使用して)エクスポートしてから、期待される0のベクトルに対してlm()を実行したいと思います。
行列をRに取り込むためのエクスポート関数は次のとおりです。
そこで、lm()関数を実行して、決定係数の2乗値を取得します。
決定係数の値を取得するには、この時点でsummary(fm)を使用する必要があることはわかっていますが、それらを引き出す方法や、この時点での意味がわかりません。各列で期待される0値からの偏差の重要性を知りたい。
ありがとう!
r - R の線形モデルの係数と要約に対するさまざまな NA アクション
R で を使用する場合、 への呼び出し内lm()
に設定すると、要約テーブルに推定できない係数の NA があります (この場合はセルが欠落しているため)。na.action = na.pass
lm()
summary(myModel)$coefficients
ただし、またはを使用して集計オブジェクトから係数のみを抽出するとcoef(summary(myModel))
、NA は省略されます。
要約を印刷するときに含まれるのと同じ方法で係数を抽出するときに、NA を含めたいと思います。これを行う方法はありますか?
設定options(na.action = na.pass)
は役に立たないようです。
次に例を示します。
r - 回帰結果:デフォルトの表示形式
lm()関数を使用してRで回帰を実行していますが、結果を単純な形式で表示することができません。p値のベクトルを出力する必要があります。
科学的記数法を無効にして、妥当な精度を得るにはどうすればよいですか?options(scipen = 1000)を試しましたが、数字の行が無限に表示されます。どういうわけか、options(digits = 7)はここでは機能しません。
フォーマットやスプリントなどを使用できることはわかっていますが、すべての数値出力にデフォルトの表示ルールを設定したいと思います。たとえば、小数点以下6桁以下です。
r - lm data.frame の複数のサブセットをフィッティングする
線形モデルをデータのサブセットに適合させたいシミュレーションを実行しています。
これは機能しますが、最初にフィットのために新しい data.frame を作成する、より単純なアプローチを使用したいと思います。
すべてのケースに適合し、
(これ... | id
は明らかに無効な構文です)
一度に完全なデータに対して予測を使用し、
lm()
こういう使い方のコツってありますか?それともより良い解決策ですか?ありがとう。