0

最終製品の予測可能性を向上させるために補助データ ソースを使用することの重要性を見つけるためのコードを開発しようとしています。分析用の私の好みのプログラムである matlab でデータの準備ができています。

次の方程式を解こうとしています。

P(t,i) = a(i) + b(i)*Z(t,i) + c(i)*Y(t,i) + d(i)*X(t,i) + e(私は、Wi)

ここで、P、Z、Y、X、W は既知であり、t および i はインデックスであり、P の既存の値と予測値の差を最小化する a、b、c、d、および e の値を見つけたいと考えています。 P.

t = 1:20 および i ~ 1:250000

最終的には、e(i) の値をゼロに設定し、追加の変数を追加することでどの程度改善されるかを確認してから、乱数ストリームでもテストします。

詳細が必要な場合は、提供しようと思います。

以下に提案する方法を試しましたが、Z、Y、および X の値が行列であるため、出力行列 sol は t の幅の 3 倍 + e の 1 つの要素です。私はさらに読んで、方法は一般化線形モデルまたはパネル回帰モデルのいずれかである必要があると考えていますが、設定方法がわかりません。Mathworks の例を何度か読み直しましたが、まだ混乱しています。

4

1 に答える 1

0

を使用して係数を計算できます。mldivideここで、MATLAB は過決定システムの最小二乗解を提供します。私が質問を正しく理解していれば、すべての係数を計算したいiので、繰り返し処理する必要がありますi

コードでは、次のようになります (テストされていません)。

for i=1:250000
  M = [ones(size(P(:,i))), Z(:,i), Y(:,i), X(:,i), W(:,i)];
  sol = M\P(:,i);

  a(i) = sol(1);
  b(i) = sol(2);
  c(i) = sol(3);
  d(i) = sol(4);
  e(i) = sol(5);
end

詳細については、ドキュメントを参照してください。

于 2015-04-29T13:41:06.593 に答える