0

ビジネスケース:現場での燃料消費量の予測。

燃料消費量Cは、さまざまな要因x1、x2、...xnに依存するとします。つまり、数学的に言えば、C = F {x1、x2、...xn}です。私にはこれを置く方程式がありません。

Cとx1、x2などの相関関係を取得できる履歴データセットがあります。C、x1、x2、..はすべて定量的です。変数方程式の場合、統計知識が限られている私のような人にとって、相関関係を見つけるのは難しいようです。

それで、私は同じためにいくつかの教師あり機械学習技術を採用することを考えていました。次の消費の予測を得るために、履歴データを使用して分類器をトレーニングします。

質問:私は正しい方法で考えていますか?質問:これが正しければ、私のシステムは進化しているはずです。したがって、システムにフィードする実際のデータが多いほど、モデルが進化して、次回より良い予測ができるようになります。これは正しい理解ですか?

上記のステートメントが当てはまる場合、Mahoutに存在するAdaptiveLogisticRegressionアルゴリズムは私に役立ちますか?

ここで専門家にアドバイスをお願いします!

前もって感謝します。

4

1 に答える 1

1

わかりました、相関関係は予測モデルではありません。相関は、共分散に基づくデータセット間の何らかの関係を単純に示しています。

予測モデルを開発するために実行する必要があるのは回帰です。

回帰の最も単純な形式は線形単変量であり、C = F(x1)です。これはExcelで簡単に実行できます。ただし、Cはいくつかの変数の関数であると述べています。このために、線形多変量回帰を使用できます。これを実行できる標準パッケージ(たとえばExcel内)があります。または、Matlabなどを使用できます。

ここで、CとXの成分(入力ベクトル)の間に「線形」関係があると仮定しています。関係が線形でない場合は、より高度な方法(非線形回帰)が必要になります。これは、機械学習の方法を非常によく使用している可能性があります。

最後に、一部のシリーズは自己相関を示します。この場合、C = F(x1、x2、x3 ... xn)の関係を無視し、代わりにARMAなどの時系列手法を使用してC関数自体を直接モデル化できる可能性があります。複雑なバリアント。

これがお役に立てば幸いです、Srikant Krishna

于 2013-01-30T19:13:48.043 に答える