問題タブ [lm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R の xts を使用した回帰
次のタイプの xts オブジェクトを使用して回帰を実行するユーティリティはありますか:
wheremy_xts
は とをxts
含むオブジェクトです。質問のポイントは、すべてのラグを処理するために、一連のラグとマージを回避する方法があるということです。パッケージはオブジェクトに対して機能すると思うので、同じように機能すると予想されますが、何かが更新される可能性があります。x
y
data.frame
dyn
zoo
xts
r - `NA`値の場合、 `lm()`からの近似値をデータフレームと一致させます
これは本当に些細な質問に違いありませんが、私は解決策を得るのに苦労しています。これが私の問題です:
これは動作します
これは(もちろん)機能しません
しかし、2番目の例をどのように機能させるのですか?row.names
inを介して解決策を試しましたmodel.matrix()
が、回帰に特定の要因を含めると、これは機能しません(これを正しく理解している場合、これはバグとして報告されています)。よろしくお願いします!
r - 線形モデル(lm)からx値を予測する方法
私はこのデータセットを持っています:
私は以下を使用して線形モデルを計算しましたlm()
:
たとえば、x
新しい値がある場合の予測値を知りたいのですが、関数を使用すると、新しい値のみが計算されます。y
ynew <- c(5.5, 4.5, 3.5)
predict()
y
x
新しい値がある場合、どうすれば新しい値を予測できy
ますか?
r - 線形最小二乗フィッティング
DF
DF2
DF は、異なる 'ex' 値をもたらす 'a'、'b'、および 's' 値の何百もの組み合わせを実際に持つ大きなデータ フレームの例です。私がやりたいことは、「ex」値 (DF) が「平均」値 (DF2) に等しい「時間」で最もよく適合する「a」、「b」、および「s」の組み合わせを見つけることです。このフィッティングでは、一度に 8 つの値を比較します (つまり、times == c(0,20,40,60,120,180,240,360))。
この例では、「a」、「b」、および「s」の値に 59、140、および 1e-4 が必要です。これは、これらの「ex」の値 (DF) が「平均」の値 (DF2) に最も適合するためです。 .
「ex」(DF) が「平均」(DF2) に最も適合する値の「a」、「b」、および「s」の値が必要です
「a」、「b」、および「s」値の 1 つの可能な組み合わせが必要なので、線形最小二乗適合モデルが最適です。一度に 8 つの値を比較します。ここで、'times' == 0 - 360 です。個々の時点で最適に機能する 'a'、'b'、および 's' の値は必要ありません。8 つのすべての 'ex' (DF) が 8 つのすべての 'mean' 値 (DF2) に最もよく適合する 'a'、'b'、および 's' の値が必要です。
線形最小二乗フィッティングを使用したことはありませんが、私がやろうとしていることは可能だと思います。
r - Rのlmer()を使用した混合モデル設計の正しいフォーマット
を使用して、混合効果モデルの正しい形式を特定しようとしていますlmer()
。以下の3つのモデルはすべて同じことを達成しようとしています-単純な固定効果モデル-したがって、2つは間違っているに違いありません。
モデルにshoppers
は、商業センターの個人消費に関するデータがあります。消費者が中心からどのように分布しているかを説明する一般的な逆二乗距離関係があります。これはモデルに反映されます。これはgravity
、距離の影響をモデル化するために、より近い地区ゾーンをより遠くのゾーンよりも高く重み付けするマトリックスです。 Population
住宅地のサイズも示されています。これは正しい形式である必要があると思いますr3
が、より高いAICスコアが得られますr2
。なぜこれが正しいのか、そしてどちらが正しいのか、何か考えはありますか?
よろしくお願いします!
r - 線形モデルの変数の係数を手動で設定する方法は?
Rでは、関数の観測ではなく、特定の変数に重みを設定するにはどうすればよいですか?lm()
コンテクストは以下の通り。携帯電話など、特定の製品の個人ランキング システムを構築しようとしています。従属変数として価格に基づいて線形モデルを構築し、独立変数として画面サイズ、メモリ、OS などの他の機能を構築できます。次に、それを使用して電話の実際のコストを (宣言された価格とは対照的に) 予測し、最適な価格/良さの係数を見つけることができます。これは私がすでに行ったことです。
ここで、私にとってのみ重要ないくつかの機能を「強調」したいと思います。たとえば、大容量のメモリを備えた電話が必要な場合があるため、メモリ変数に対して線形モデルが最適化されるように、より高い重みを付けたいと考えています。
lm()
Rの関数にはweights
パラメーターがありますが、これらは変数ではなく観測の重みです(これが間違っている場合は修正してください)。また、式をいじってみましたが、インタープリター エラーしか発生しませんでした。に変数の重みを組み込む方法はありlm()
ますか?
もちろん、lm()
機能だけが選択肢ではありません。他の同様のソリューション (例: ) でそれを行う方法を知っている場合glm()
、これもかなり問題ありません。
アップデート。いくつかのコメントの後、私は問題について考えていた方法が間違っていることを理解しました. への呼び出しによって取得された線形モデルは、lm()
トレーニングの例に最適な係数を提供します。変数の重みを変更する方法はありません (必要もありません)。混乱して申し訳ありません。私が実際に探しているのは、既存の線形モデルの係数を変更して、一部のパラメーターを他のパラメーターよりも重要にする方法です。前の例を続けて、次の価格の式があるとします。
この式は、価格と電話パラメータ間の依存関係について可能な限り最良の線形モデルを表しています。ただし、memory
変数の前にある番号 30 を手動で 60 に変更したいので、次のようになります。
もちろん、この式は、価格と電話パラメーター間の最適な関係を反映していません。また、従属変数は実際の価格を示すのではなく、メモリが平均的な人よりも 2 倍重要であることを考慮して (最初の式の係数に基づいて)、実際の価格を示しません。しかし、この良さの値 (より正確には、分数の値goodness/price
) はまさに私が必要としているものです。
これがすべて理にかなっていることを願っています。ここで、1 つの (おそらく非常に単純な) 質問があります。で取得した既存の線形モデルに手動で係数を設定するにはどうすればよいlm()
ですか? つまり、次のようなものを探しています。
もちろん、このコードは機能しませんが、アイデアは得られるはずです。注:データフレームの列の値を2倍にすることは明らかに可能memory
ですが、データではなくモデルに影響を与える、よりエレガントなソリューションを探しています。
r - lm()線形モデル-属性
そのため、lm()コマンドで少し混乱します。で試してみたところ、lm(x~y, mydata)
出力lm(y~x, mydata)
が異なりました。では、どの変数をxとして使用し、どの変数をyとして使用するのでしょうか。このような初心者の質問をして申し訳ありませんが、よくわかりません。そのコマンドのパラメータを説明するものは何も見つかりません。
r - 一連の独立したフィットのために R で lm() を使用する
lm()
シリーズ(実際には93)の個別の線形回帰に適合させるためにRで使用したいと思います。lm()
Rのヘルプマニュアルによると:
「応答が行列の場合、線形モデルは行列の各列に最小二乗法によって個別に適合されます。」
これは、Y 応答マトリックスに欠損データ ポイントがない限り、正常に機能します。欠落している点がある場合、各回帰を利用可能なデータに適合させる代わりに、いずれかの列に欠落しているデータ点があるすべての行が破棄されます。lm()
Y のすべての列に個別に適合し、個々の列に欠落しているデータ ポイントがある行を破棄しない ように指定する方法はありますか?
r - R で lm コマンドから表形式の要約データを抽出する方法
次のように構造化されたデータがあります。
約 300 のグループがあり、各グループには 70 ほどの連続したデータ要素があります。
次のスクリプトを発行して、各グループの 2 次多項式を推定しました。
これらの新しい変数のそれぞれについて、要約ステートメントを発行して興味深い情報を明らかにすることができます。
私の目的のために、この情報を表に転記する必要があります。これは、この形式から切り取って貼り付けるのは非常に面倒で時間がかかります。
また、科学表記法よりも従来の表記法があると便利ですが、それがなくても生きていけると思います。
手で切り貼りせずにこれを行う方法はありますか?
ありがとう --sw
r - 予測を使用して非線形モデルの値を見つける
次のコードを試して、predictが2次の多項式の従属変数の値を見つけるのに役立つかどうかを確認しようとしています。この場合、y = x^2は明らかです。
x = 7の値を見つけようとすると、次のようになります。
私は何が間違っているのですか?