問題タブ [multiple-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RとExcelのmlr出力の違い
元々 Excel から取得したデータを使用して、R で重回帰を実行しようとしています。lm() 関数を使用して R で回帰を実行しますが、Excel のソルバー アドインの回帰機能を使用して同じ変数セットに対して同じ回帰を実行すると、実質的に異なる結果が得られます。非常に異なる R^ 2つの値、および独立変数の異なる係数。この問題の理由を知っている人はいますか?
ここで手順を明確にします。Excel でデータを作成し、各行がイベント、各列が変数になるように配置します。Excel ファイルのコピーをタブ区切りのテキスト ファイルとして保存します。
as.numeric(x1)
すべての x* と y を実行して、R がそれぞれを数値としてインポートしていることを確認しました (TRUE を返します)。
Excel でソルバー アドインを開き、[回帰] を選択し、y と x の範囲を選択して、出力を表示します。R でベクトルを手動で表示して、値が同じであることを確認しました。Excel ファイルの値を丸めて、テキスト ファイルに保存するときや R にインポートするときの丸めが問題にならないことを確認しました。 -それは修正されません。
洞察力のある人なら誰でも大歓迎です。
編集:R出力:
エクセル出力:
r - y の NA の数が多すぎるため、R で重回帰分析を実行できません
私はRを初めて使用し、約250行のデータセットに対して多数の個別の重回帰分析を実行しようとしています。少数の NA を持つ列でこれらのいくつかを正常に実行しましたが、多数の NA (48 個の NA) を持つ列での作業を拒否し、エラー メッセージ "Error in mkRespMod(fr, REML = REMLpass ) : NA/NaN/Inf in 'y'". 私が使用しているコマンドは
とにかくRに分析を実行させる方法はありますか? 私の質問があまり具体的でない場合は申し訳ありません。私はRに非常に慣れていないため、問題が何であるかさえよくわかりません。誰も私の頭を噛まないでください。助けてくれてありがとう
r - 多重回帰 - サイズ 4.7GB のベクトルを割り当てることができません
まず第一に、私は R とコーディング自体について手がかりがないと言いたいです。学士論文のためにクラスター化された標準誤差を使用して回帰を行う必要があるだけで、Excel ではそれを行うことができません。クラスター化された標準誤差を使用して線形回帰を行うことができましたが、(クラスター化を行わなくても) 重回帰を実行すると、「サイズ 4.7gb のベクトルを割り当てることができません」というエラー メッセージが表示されます。8 GB RAM を搭載した PC で 64 ビットの Windows 7 バージョンを実行しています。これらの 8 GB も R によって考慮されます。
> memory.limit()
[1] 8168
これは私が使用する関数であり、エラーメッセージRが吐き出します:
関数でわかるように、私はすでに big.memory パッケージを使用しようとしていますが、間違っているか (非常に可能性が高い)、うまくいかないかのどちらかです。
私が使用しているデータベースには、10列の38104の観測があります=> 38104 * 10
単純回帰のクラスタリングに使用した関数は次のとおりです。
私と一緒に:
ここや他のサイトでいくつかの投稿をチェックしました。いくつか試してみましたが、同じエラーメッセージが表示されます。繰り返しますが、私は R とコーディングについてまったく手がかりがないので、これを行うための最も簡単な方法が本当に必要です :D
r - 重回帰の R 二乗を求める
質問に 10 個の変数がある場合
正確に 2 つの変数を使用して、最大の調整 R 二乗値を与えるモデルを見つけます。
ここで、xi と xj は、x1、x2、...、x10 の間の任意の変数にすることができます
たとえば、調整された R-squared を比較したい
. . .
「for loop」コマンドを使用してすべての結果を比較する方法はありますか?
python - ブルート フォースは、Python を使用した重回帰の最適なオプションですか?
線形モデル = 0 + 1 × i + 2 × j + 3 × k + において、j,k ∈ [1,100] のどの値が最大の R-Squared を持つモデルになりますか?
データセットは、100 個の独立変数と 1 つの従属変数で構成されています。各変数には 50 個の観測値があります。
私の唯一の推測は、3 つの変数のすべての可能な組み合わせをループし、各組み合わせの R-2 乗を比較することです。私がPythonで行った方法は次のとおりです。
完了するまでに 4.3 分かかりました。この方法は、変数ごとに数千の観測値を持つデータセットには効率的ではないと思います。代わりにどのような方法を提案しますか?
ありがとうございました。