問題タブ [predict]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R の Predict.lm が newdata を認識できない
予測子が別の値で分類される線形回帰を実行していますが、新しいデータのモデル化された応答を生成するのに問題があります。
最初に、予測子と誤差項のランダム値をいくつか生成します。次に、応答を作成します。予測子の係数は、カテゴリ変数の値に依存することに注意してください。予測子とそのカテゴリに基づいて計画行列を構成します。
警告は次のとおりです。
「newdata」には 5 行ありましたが、見つかった変数には 10 行ありました
私が非常に間違っていない限り、変数名に問題はないはずです。(この掲示板には、その問題を示唆する議論が 1 つまたは 2 つあります。) 最初の予測は正常に実行されますが、2 番目の予測はうまくいかないことに注意してください。唯一の変更点は、2 番目の予測が計画行列の最初の 5 行のみを使用することです。
考え?
r - Rの予測メソッドで使用するx値を知る方法は?
私は線形モデルを当てはめました:
そこから予測メソッドを使用しました
しかし、predict メソッドは期待どおりの結果を提供しません。次の画像では、適合範囲を赤くマークしています。
青は予測値
しかし、予測値は期待される点から始まりません。予測された点の最初の y 値は、最初に当てはめられた値と同じ点から始まると予想していました。
だから今、私はなぜこれが起こらないのかを知っています。既知の x 値から未知の y 値を予測したからです。しかし、青い線が赤い線に関連付けられていることがわかるように、青い線を下に移動するにはどうすれば簡単に達成できますか? したがって、使用する x 値をどのように知ることができますか?
stata - 次のロジットを予測すると「指定された変数が多すぎます」エラー
いくつかの国にまたがるデータのパネル (企業年数) があります。logit
国ごとに、最初の 5 年間を使用してモデルを推定し、このモデルを使用してpredict
、その後の数年間の確率を計算します。私foreach
は国をforvalues
ループし、その後の年をループします。
最初の数カ国は (推定と予測の両方で) うまく機能しますが、5 番目の国の最初の標本外予測は次のように失敗します。
モデルは適合し、1994 年には確率を予測するのに十分なデータがあります。私のpredict
電話は:
このエラーの原因は何ですか? 同じループの他の場所で作業しているためlogit
、私は混乱しています。predict
ありがとう!
FWIW、これが .do ファイルです。
更新: Idrop (country == "United Kingdom")
の場合、同じ問題が米国 (パネルの次と最後の国) に移行します。Idrop inlist(country, "United Kingdom", "United States")
の場合、問題はなくなり、.do ファイルが実行されます。
r - 通常のパッケージからclmm2を使用してse.fitと信頼区間を取得する際の問題
累積混合モデルをデータに適合させるために、Rの序数パッケージのclmm関数を使用しています。予測された確率を取得しようとするまでは正常に機能しました。se.fit=TRUEおよびinterval=TRUEを指定しても、SEまたは信頼区間を取得できません。次のようになります。
ご覧のとおり、そこにはたくさんの相互作用があります(すべて重要です)。問題を再現できるようにダミーのデータセットを作成しようとしましたが、clmmはより単純なデータセットで収束を達成できません。パッケージ序数に含まれているワインデータセットを取得し、式を変更して自分のデータセットを模倣しました(ただし、意味がないと思います)。
そして、私はこのエラーを受け取ります:
私の推測では、このような場合、predictはSEとICを計算しません。誰かがその理由を知っていますか?それらの値を取得する方法はありますか?
どうもありがとう!
r - R read.csvをreadLinesバッチに変換しますか?
CSVとして保存された新しいデータセットをスコアリングするために適用したいフィットモデルがあります。残念ながら、新しいデータセットはかなり大きいので、一度にすべてを実行すると、predictプロシージャのメモリが不足します。そこで、以下の小さなセットでうまく機能した手順を、一度に500行を処理し、スコアが500ごとにファイルを出力するバッチモードに変換したいと思います。
この回答(Rで行ごとに読み取る良い方法は何ですか?)から、これにreadLinesを使用できることがわかります。だから、私はから変換するでしょう:
次のようなものに:
ただし、ループ内でmylinesオブジェクトを印刷すると、read.csvが次のようなものを生成するのと同じように、正しく自動列化されません---ヘッダーはまだ混乱しており、モジュロ列幅が内部で発生しますベクトルをncolオブジェクトにラップすることは発生していません。
最初の行を切り取ったり、列を折り返したりするような野蛮なことを書いていることに気付いたときはいつでも、一般的にRの方が良い方法だと思います。readLines csv接続からread.csvのような出力を取得する方法についての提案はありますか?
r - 警告を予測する
テスト データ フレームの値を予測しようとしているときに、この警告が表示されます。ツリーを構築して予測するための私のコードは次のとおりです。
ここで同様の投稿を読んだので、この行を置き換えました
に
データセットの列に名前を付けるコードですが、それでも同じ警告が表示され、予測が間違っています:-/
r - r holtwinters は予測します
私はしばらくRを使用していますが、数日前に、特定の時系列で予測を行う非常に興味深い関数を見つけました。既知の時系列からデータを取得し、特定の期間に適用しただけで、パターンは維持されました。問題は、私がそれを失ったことです。一種の HoltWinters だったと確信しています。私は何かを見つけるために2日間試みていますが、今まで成功していません. 誰か私に手を貸してください!
r - lmを使用して、行列のデータを予測します
私はR
ほんの少ししか使用せず、データフレームを使用しないため、predictの正しい使用法を理解するのは困難です。私は自分のデータをデータフレームではなく単純な行列に入れてa
おりb
、それぞれN x p
とM x p
行列であるとと呼んでいます。回帰を実行できますlm(a[,1] ~ a[,-1])
。lm
結果のオブジェクトを使用してから予測b[,1]
したいと思いますb[,-1]
。私の素朴な推測はうまくいきpredict(lm(a[,1] ~ a[,-1]), b[,-1])
ません。lm
予測のベクトルを取得するためにを使用するための正しい構文は何ですか?
r - R予測関数:長さゼロの予測を返すのはなぜですか?
更新: naiveBayes に e1071 パッケージを使用しています
私はRが初めてで、おもちゃのデータを中心に単純ベイズモデルを構築しようとしています。次に、そのモデルで「predcit」を呼び出そうとしました。私が見た問題は、「predict()」の結果の長さがゼロです。簡単な R 再現コードを参照してください。ご意見をお寄せいただきありがとうございます。
python - python pandas OLS.predict、正しい署名は何ですか?
私はパンダOLSモデルを持っています、
-------------------------回帰分析の概要--------------------- --------
式:Y〜 <1> + <2> + <3> +
観測数:56自由度:4
決定係数:0.2864調整決定係数:0.2452
Rmse:0.0001
F統計(3、52):6.9554、p値:0.0005
自由度:モデル3、残留物52
-----------------------推定係数の概要----------------------- -
---------------------------------要約の終わり-------------- -------------------
予測する必要がある場合、y
からの値[0.000207, -0.000361, -0.000091]
上記のように署名は何を使用する必要がありpredict
ますか?