問題タブ [lm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R線形回帰の問題:lm.fit(x、y、offset = offset、singular.ok = singular.ok、...)
Rで回帰を試みます。CSVファイルのインポートに問題のない次のコードがあります。
ただし、回帰を試みても機能しません。エラーメッセージが表示されます:
私のCSVファイルはすべて数字であり、「セル」が空の場合は「NA」の値になります。一部の列は空ではなく、他の行はNA値なしで空になることがあります。
だから、私はなぜ私がエラーメッセージを受け取るのか理解していません:
PS:CSVのデータは http://pastebin.com/EWsLjKNNで入手できます。
r - R の Predict.lm が newdata を認識できない
予測子が別の値で分類される線形回帰を実行していますが、新しいデータのモデル化された応答を生成するのに問題があります。
最初に、予測子と誤差項のランダム値をいくつか生成します。次に、応答を作成します。予測子の係数は、カテゴリ変数の値に依存することに注意してください。予測子とそのカテゴリに基づいて計画行列を構成します。
警告は次のとおりです。
「newdata」には 5 行ありましたが、見つかった変数には 10 行ありました
私が非常に間違っていない限り、変数名に問題はないはずです。(この掲示板には、その問題を示唆する議論が 1 つまたは 2 つあります。) 最初の予測は正常に実行されますが、2 番目の予測はうまくいかないことに注意してください。唯一の変更点は、2 番目の予測が計画行列の最初の 5 行のみを使用することです。
考え?
r - Rの予測メソッドで使用するx値を知る方法は?
私は線形モデルを当てはめました:
そこから予測メソッドを使用しました
しかし、predict メソッドは期待どおりの結果を提供しません。次の画像では、適合範囲を赤くマークしています。
青は予測値
しかし、予測値は期待される点から始まりません。予測された点の最初の y 値は、最初に当てはめられた値と同じ点から始まると予想していました。
だから今、私はなぜこれが起こらないのかを知っています。既知の x 値から未知の y 値を予測したからです。しかし、青い線が赤い線に関連付けられていることがわかるように、青い線を下に移動するにはどうすれば簡単に達成できますか? したがって、使用する x 値をどのように知ることができますか?
r - データが LM の予測線に対してどれだけうまく *中心化* されているかの尺度は何ですか?
lm
R のコマンドを使用してプロットする 2 つのデータセットがあります。以下の最初のプロットは、赤い線の中央に配置されていません。しかし、右側の 2 番目のグラフは、線に向かって中央に配置されています。
私の質問は次のとおりです。
- データが線の中心にどれだけうまく配置されているかの尺度は何ですか?
- データ構造からそれを抽出する方法は?
そのデータをプロットするために使用するコードは次のとおりです。
RMSE スコアでプロットを更新します。
予測線を中心としたデータに基づいて、右の図が左の図よりも優れていることを示すスコアを探しています。
r - 要約の p 値と R lm() の anova の違い
これにアクセスする方法に応じて、anova の p 値に違いが見られます。
サマリーによって返される値と同じ値を取得する方法はありますか?
簡単に表現できるケースでは、サマリーと anova で < 2.2e-16 が返されますが、値に直接アクセスすると 8.129959e-100 が返されます。
別のより表現が難しいケース (さらに多くのデータがあります) では、p 値が得られます: 要約では < 2.2e-16 ですが、anova では 0 です。
サマリーと分散分析で返される実際の値を取得する方法はありますか?
私は本当にあなたの助けに感謝します -
r - ローリング回帰は複数のオブジェクトを返します
ここの例に基づいてローリング回帰関数を作成しようとしていますが、予測値を返すことに加えて、いくつかのローリングモデル診断(つまり、係数、t値、およびmabye R ^ 2)を返したいと思います。結果の種類に基づいて、個別のオブジェクトで結果を返したいのですが。上記のリンクで提供されている例は、ローリング予測を正常に作成しますが、ローリングモデルの診断をパッケージ化して書き出すための支援が必要です。
最後に、関数が3つのオブジェクトを返すようにします。
- 予測
- 係数
- T値
- R ^ 2
以下はコードです:
それで、モデル(つまりmod)からt値を抽出する方法を理解した後、関数が3つの別々のオブジェクト(つまり、予測、係数、およびT値)を返すようにするにはどうすればよいですか?
私はRにかなり慣れておらず、関数に本当に慣れておらず、動物園に非常に慣れていません。
どんな援助でも大歓迎です。
r - 変数を使用してlmを呼び出す方法は?
次の関数が与えられます:
次の呼び出しは失敗します。
明らかに列をlm
検索し、変数名をその内容に置き換えるのではないため)。どうすればこれを修正できますか?x
y
表現をいじってみましsubstitute
たが、無駄になりました。残念ながら、Rがこれらのオブジェクトをどのように処理し、どのコンテキストで式が評価されるのかを完全には理解していないため、結果として盲目的に飛んでいます。これが私が試したものです(動作していません):
検査するとき、exp
オブジェクトは実際に有望に見えます。残念ながら、私はlm
それを飲み込むように説得することはできません。
r - R: 因数付きの lm()。ANOVA テーブルの "Sum Sq" の計算方法がわかりません
私はRを学んでおり、lm()
因子変数を処理する方法とANOVAテーブルを理解する方法を理解しようとしています. 統計初心者なので、お手柔らかにお願いします。
Rotten Tomatoes のムービー データを次に示します。G、PG、PG-13、および R と評価された 4 つのグループのすべての映画の平均スコアに基づいて、各映画のスコアをモデル化しようとしています。
および ANOVA 出力:
このテーブルのすべての数値を取得する方法を理解しています。例外Sum Sq
とMean Sq
for as.factor(movies$rating)
. Sum Sq
誰かが私のデータからどのように計算されるか説明してもらえますか? で割ったMean Sq
だけだと分かります。Sum Sq
Df
r - NAを置き換えるための推定値
NA値を置き換えるために、それらの時系列内の推定値を計算したいいくつかの時系列で構成されるデータセットがあります。私はddply()とlm()に精通していますが、これに少し問題があります。
これが1つのデータフレームの最初の5つのステーションです
ここに行く...
データが7年未満の場所を削除する必要があります。データセット全体には、数百の場所があります...
それから
NAを正しい月間位置平均に置き換えます
個々のステーションの月平均を計算して、そのステーションの月に関連付けられたNAを配置しようとしています。
私はここで立ち往生しています...
どんな助けでも大歓迎です...
どうもありがとう。ジェシー
r - g の 1 つの値を無視する lm(y~x*g)
初めてRを使ってみました。
この場合、y
は酸素消費量、x
は時間、g は最大 3 文字 (NYF、IR、F、M、または NF) で示されるステータスです。F を除く各ステータスのリグレッションが実行されます。
[補足: サブセット関数を使用して多重回帰でこれを達成しようとしました。私が使うとき
実際にはサブセットに準拠しておらず、入力したステータスに関係なく、データセット全体の回帰が得られます.
status
列のコードに基づいて、単一のデータセットから複数の単純な線形回帰を取得するにはどうすればよいですか?