問題タブ [non-linear-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - r の多項式相互作用が大きい回帰 (大きなデータ)
R を使用して最適なモデルを選択するプロジェクトに取り組んでいます。
15 個の変数があり、サンプル サイズは 790,000 です。線形モデルは、残差がランダムではなく、正規ではないため機能しません。
そこで、より高い多項式と相互作用で非線形モデルを実行しようとしました。ただし、R は非常に遅く、データセットが大きいため時々シャットダウンします。
ステップワイズ関数、ポリム関数を使用してみましたが、どちらも理想的ではありませんでした。高次多項式と相互作用のための関数/パッケージはありますか? ループを書くとしたら、プロットを見ずに各シナリオの残差の正規性とランダム性をチェックするにはどうすればよいでしょうか? (Sharpe テストは、大きなサンプル サイズでは機能しません)。どうもありがとう!
更新: fit2b <- lm(f$Assets ~ polym(f$C,f$Suc,f$SP,f$SS, f$Qual_P, f$A, f$TotalAA, f$Eq,f$D, f $PE, f$EI, f$GE, f$EO, 次数 = 5, raw=TRUE) + f$Gender + f$LT)
fit1b = lm(f$Assets ~ f$A)
step(fit1b, scope = list(upper=fit2b, lower=~1 ), direction = "forward", trace=FALSE)
また、vif 以外に多重共線性を検出するツールが他にあるかどうか、またそれに対処するためにモデルをどのように調整すればよいか疑問に思っています。
r - nls() 偽の収束 (開始値が適切であるにもかかわらず)
私は、3 つの指数関数的に修正されたガウス (EMG) を畳み込み曲線に適合させる曲線適合スクリプトに取り組んできました。私の基底関数はガウス分布に似ていますが、関数の指数成分の重みを決定する3 番目のパラメーター (最初の 2 つはmu
と) が含まれています。sigma
したがって、全体として、各 EMG ピークは 3 つのパラメーターと振幅係数を取ります (実験データを値 > 1.0 と一致させるため)
3 つの EMG ピークをデコンボリューションするには、最小化するパラメーターの総数は 3x4 = 12 です。
うまくフィットする場合もありますが、多くの場合、収束に失敗し、次のようなエラーが返されます。
わずか 50 回程度の繰り返しの後 (制限をはるかに下回ります)。
トレース オプションを使用すると、結果がデータに非常に近いことがわかります。また、最初の推定値から曲線をプロットすると、開始パラメーターがデータにかなり近い範囲内にあることもわかります。
データ = 黒 (ノイズを追加)、初期 = オレンジ、エラー前の最終反復 = 赤
これが私のコードのサンプルですnls()
。
では、アルゴリズムが成功しているように見えるのに、なぜエラーが発生するのでしょうか?
r - calculate gaussian curve fitting on a list
I have a list data like below. I want to perform nonlinear regression Gaussian curve fitting between mids and counts for each element of my list and report mean and standard deviation
I have read this Fitting a density curve to a histogram in R but this is how to fit a curve to a histogram. what I want is Best-fit values"
" Mean" " SD"
If I use PRISM to do it, I should get the following results for A
performing nonlinear regression Gaussian curve fitting , I get
for the second set B
and for the third one
I get this
tensorflow - Tensorflow の多項式回帰で損失が収束しない
Tensorflow で多項式回帰 (二次) を実装しようとしています。損失が収束していません。誰でもこれで私を助けてくれませんか。ただし、線形回帰でも同様のロジックが機能しています。
r - error fitting function to data using nls
I have some issue using nls()
to estimate parameters. I have a following set of functions to explain some data in hand:
I am trying to fit funk2
to y
:
When I use nls()
:
it shows me following error:
Error in f(x, ...) : object 'l' not found
Isn't the whole point of nls()
to substitute different values for parameters l
and r
from parameter space to fit the function by minimizing SSR and give the parameter estimates? why it needs value of l
for it to work? I am definitely missing something big here. Please help!
Thanks in advance!
r - optim を使用して r の尤度を最大化する際のエラー
だから、私はこれらの機能を持っています:
これは、データ y を説明するために使用されます。
optim を使用して尤度を最大化したいので、尤度関数を定義しました。
そして私はoptimを使ってフィットしようとしました
しかし、私はエラーが発生します:
なぜかわからないのですが?nls フィッティング funk2(x,l,r) を y に実行できます
これは、funk2 が機能していることを意味します。私が設計したLL関数の問題だと思いますが、わかりません!! 助けてください!
matlab - MATLAB の非線形フィッティングでパラメータを強制的に積分する
MATLABの関数を使用してlsqcurvefit
、パラメーターの 1 つに整数型を適用するにはどうすればよいですか? 問題の特定のパラメーターはベクトルのインデックスであるため、整数値のみが意味を持ちます。ただし、フィッティング ルーチンは、反復中にパラメーターの任意の実数値を試す場合があります。
algorithm - 正規分布のターゲット値でトレーニングすると、非線形回帰アルゴリズムのパフォーマンスが向上しますか?
ボックスコックス変換など、データセットのターゲット値 (y 列) に適用できる多くの変換について調べた後、線形回帰モデルを効率的にするには、正規分布したターゲット値でトレーニングする必要があることを学びました。 .( https://stats.stackexchange.com/questions/298/in-linear-regression-when-is-it-property-to-use-the-log-of-an-independent-va )
非線形回帰アルゴリズムにも同じことが当てはまるかどうか知りたいです。今のところ、xgboost を使用して、kaggle の人々が対数変換を使用して不均一分散を緩和するのを見てきましたが、正規分布のターゲット値を取得するためにも行われているかどうかについては言及していません。
私はいくつかの調査を試みましたが、Andrew Ng の講義ノート ( http://cs229.stanford.edu/notes/cs229-notes1.pdf ) の 11 ページで、最小二乗法は線形の多くのアルゴリズムで使用されるコスト関数であることがわかりました。および非線形であり、エラーの正規分布を仮定することによって導き出されます。エラーが正規分布する必要がある場合、ターゲット値も同様に分布する必要があると思います。これが当てはまる場合、最小二乗コスト関数を使用するすべての回帰アルゴリズムは、正規分布のターゲット値でより適切に機能するはずです。
xgboost はノード分割に最小二乗コスト関数を使用するため ( http://cilvr.cs.nyu.edu/diglib/lsml/lecture03-trees-boosting.pdf - スライド 13)、ターゲットを変換すると、このアルゴリズムがうまく機能する可能性があります。モデルのトレーニングにボックス コックス変換を使用して値を取得し、予測値を取得するために出力に逆ボックス コックス変換を適用します。これは理論的に言えば、より良い結果をもたらすでしょうか?
python - Pythonでmordモジュールを使用して順序回帰を行うにはどうすればよいですか?
いくつかの機能に基づいてラベルを予測しようとしていますが、いくつかのトレーニング データがあります。
Pythonで序数回帰を検索すると、http://pythonhosted.org/mord/が見つかりましたが、使用方法がわかりませんでした。
誰かがこのモジュールの使用方法を示すサンプル コードを持っていれば、それは素晴らしいことです。mord モジュールのクラスは次のとおりです。