問題タブ [linear-regression]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
12030 参照

r - R: 特定の値を予測できない

predict関数が age=15 を予測できないのはなぜですか?

0 投票する
1 に答える
2892 参照

math - 多変量線形回帰用の純粋なPythonコード

バグ(おそらく私が使用しているnumpyディストリビューションにある)のため、を使用できませんnumpy.linalg.lstsq。そして、私が見つけたすべての統計ライブラリは、Python 3(Windows)ではインストールされませんでした。

誰かが重回帰を実行する純粋なPython3コードを持っていますか(私はベータが必要です)?

純粋なPythonでない場合でも、コードがnumpy.linalg.lstsq私のマシンでクラッシュするのと同じC関数を使用していない可能性がある場合は、それを試すことができます。

ありがとう!

0 投票する
2 に答える
8857 参照

python-3.x - 行列が整列していません エラー: Python SciPy fmin_bfgs

問題の概要: scipy.optimize.fmin_bfgs 最小化 (最適化) 関数を使用しようとすると、関数は

derphi0 = np.dot(gfk, pk) ValueError:行列が整列していません

エラー。私のエラー チェックによると、これは fmin_bfgs を介した最初の反復の最後 (値が返されるか、コールバックへの呼び出しの直前) で発生します。

構成: Windows Vista Python 3.2.2 SciPy 0.10 IDE = PyDev を使用した Eclipse

詳細な説明: 単純なロジスティック回帰の実装 (Octave から Python/SciPy への変換) のコストを最小限に抑えるために、scipy.optimize.fmin_bfgs を使用しています。基本的に、コスト関数はcost_arr関数と名付けられ、勾配降下はgradient_descent_arr関数にあります。

*cost_arr* と *gradient_descent_arr* が適切に機能し、すべての値が適切に返されることを手動でテストし、完全に確認しました。また、適切なパラメーターが *fmin_bfgs* 関数に渡されることを確認するテストも行いました。それにもかかわらず、実行すると ValueError: matrixs are notaligned が発生します。ソースレビューによると、正確なエラーは

def line_search_wolfe1 # Minpack の Wolfe 行と scipy パッケージで提供されるスカラー検索の関数。

特に、代わりにscipy.optimize.fminを使用すると、 fmin関数が最後まで実行されます。

正確なエラー:

ファイル "D:\Users\Shannon\Programming\Eclipse\workspace\SBML\sbml\LogisticRegression.py"、395 行目、fminunc_opt 内

ファイル "C:\Python32x32\lib\site-packages\scipy\optimize\optimize.py"、533 行目、fmin_bfgs old_fval,old_old_fval 内)
ファイル "C:\Python32x32\lib\site-packages\scipy\optimize\linesearch. py"、76 行目、line_search_wolfe1 derphi0 = np.dot(gfk, pk) ValueError: 行列が整列していません

次のように最適化関数を呼び出します: optcost = scipy.optimize.fmin_bfgs(self.cost_arr, initialtheta, fprime=self.gradient_descent_arr, args=myargs, maxiter=maxnumit, callback=self.callback_fmin_bfgs, retall=True)

これを修正するために数日を費やしましたが、 マトリックスが整列していないエラーの原因を特定できないようです。

補遺: 2012-01-08 私はこれにもっと取り組み、問題を絞り込んだようです (しかし、それらを修正する方法に困惑しています)。まず、fmin (fmin のみを使用) は、これらの関数 (コスト、勾配) を使用して機能します。第 2 に、手動実装 (fmin_bfgs を使用しない) で 1 回の反復でテストすると、コスト関数と勾配関数の両方が期待値を正確に返します。3 つ目は、optimize.linsearch にエラー コードを追加したところ、次の行の def line_search_wolfe1 でエラーがスローされたようです: derphi0 = np.dot(gfk, pk)。ここで、私のテストによると、 scipy.optimize.optimize pk = [[ 12.00921659] [ 11.26284221]]pk type = および scipy.optimize.optimizegfk = [[-12.00921659] [-11.26284221]]gfk type = 注: 私によるとテストでは、fmin_bfgs を介した最初の反復でエラーがスローされます (つまり、fmin_bfgs は単一の反復または更新を完了することさえありません)。

ガイダンスや洞察に感謝します。

以下の私のコード (ロギング、ドキュメントは削除されました): theta = 2x1 ndarray を想定 (実際: theta Info Size=(2, 1) Type = ) X = 100x2 ndarray を想定 (実際: X Info Size=(2, 100) Type = ) y = 100x1 ndarray と仮定します (実際: y Info Size=(100, 1) Type = )

0 投票する
1 に答える
685 参照

matlab - matlabのリッジとA\bの違い

同じと L2 正則化パラメータが与えられた場合A、とが 2 つの異なる解を与えるのはなぜですか?bbeta = 0ridge\

0 投票する
1 に答える
1804 参照

python - 複数の変数を使用した線形回帰-Python-実装の問題

複数の変数(実際には、2つだけ)を使用して線形回帰を実装しようとしています。MLクラスのスタンフォードのデータを使用しています。単一変数の場合は正しく機能しました。同じコードが複数の場合に機能するはずですが、機能しません。

データへのリンク:

http://s3.amazonaws.com/mlclass-resources/exercises/mlclass-ex1.zip

機能の正規化:

NumPy / SciPyを使用する代わりに、コードに平均と標準偏差を実装しました。値をファイルに保存した後、そのスナップショットは次のとおりです。

X1 X2 X3 COST OF HOUSE

パラメータを見つけるために回帰を実行します。そのためのコードは以下のとおりです。

パラメータとして以下を出力します。

[-3.8697149722857996e-14、0.02030369056348706、0.979706406501678]

3つすべてがひどく間違っています:(まったく同じことが単一変数でも機能します。

ありがとう !

0 投票する
4 に答える
9013 参照

python - Pythonでのセグメント化された線形回帰

セグメント化された線形回帰を行うための Python のライブラリはありますか? 次のようなものを取得するために、複数の行を自動的にデータに合わせたいと思います。 セグメント回帰

ところで。私はセグメントの数を知っています。

0 投票する
1 に答える
190 参照

math - covar 行列と平均のみを使用した重回帰

変数 y1 (従属変数)、x1、x2、x3 (独立変数) の包括的な共分散行列と、各変数に関連付けられた平均値があります。共分散行列と平均値のみを使用して重回帰を実行するにはどうすればよいですか?

0 投票する
2 に答える
3906 参照

r - rapplyコマンドを介して乗算回帰から回帰係数を抽出します

いくつかの変数を含む大規模なデータセットがあります。そのうちの 1 つは、州ごとに 1 ~ 50 でコード化された州変数です。データセットの残りの 27 個の変数 (合計 55 個の変数があります) で 28 個の変数の回帰を実行し、各州に固有のものを実行したいと思います。

つまり、state==1 の観測値に対して、共変量 1、共変量 2、...、共変量 27 で変数 1 の回帰を実行します。次に、状態 2 ~ 50 の変数 1 に対してこれを繰り返し、変数 2、変数 3、...、変数 28 に対してプロセス全体を繰り返します。

これを行うための正しい R コードを作成したと思いますが、次にやりたいことは、係数を理想的には係数行列に抽出することです。誰かがこれで私を助けてくれますか? これまでに書いたコードは次のとおりです。

0 投票する
2 に答える
1091 参照

java - 再帰的時系列セグメンテーション アルゴリズム

私は株式市場データの時系列分析を行っており、区分線形セグメンテーションのアルゴリズムを実装しようとしています。これは次のとおりです。

私の時系列クラスは次のとおりです。

上記のアルゴリズムでは、Ttemp は時系列の別のインスタンスです。4 行目から 12 行目までの計算は、誤差を計算するためのものです。
問題は、上記の再帰部分と結合部分 (14 行目と 15 行目) を実装できないことです。再帰して MySeries オブジェクトの結合を作成する方法がわかりません。

** * ** * ** * ***編集* ** * ** * ** * ** * ** * **

私は与えられたアルゴリズムのために上記のコードを書きました..しかし、なぜそれが無限ループに陥るのかわかりません..誰かが他のデザインやコードの変更を私に提供してくれれば感謝します.

0 投票する
3 に答える
476 参照

r - 予測値に差異がないのに lm が値を返すのはなぜですか?

次の R コードを考えてみましょう (最終的に Fortran を呼び出すと思います)。

summary によって値が返されるのはなぜですか? Y には分散がないため、このモデルは当てはまらないのではないでしょうか? さらに重要なのは、なぜモデルが R^2 ~= .5 なのですか?

編集

コードを lm から lm.fit まで追跡したところ、次の呼び出しが表示されました。

それが実際の適合が起こるように見えるところです。http://svn.r-project.org/R/trunk/src/appl/dqrls.f )を見ても、何が起こっているのか理解できませんでした。なぜなら、私は fortran を知らないからです。