0

D=(x,y), y=F(x) を考えると、ほとんどの機械学習方法は、y をラベルまたは実数値の単変量としてのみ出力するようです。しかし、最大 800 次元の多項分布ベクトルであるために y が必要なのに対し、x ベクトルは 5 ~ 9 次元しか持たないという状況に直面しています。これにより、問題が非常に難しくなります。

マルチタスクの機械学習方法で多くのことを調べました。そこでは、これらすべての y_i を同時にトレーニングできます。そしてもちろん、タスク間のつながりを考慮せずに、これらすべての次元を個別にトレーニングすることもできます。しかし問題は、多くの論文を検討した結果、ほとんどの MTL 実験では 10 ~ 30 のタスクしか処理できないように思われることです。つまり、800 のタスクはクレイジーでトレーニングに適していない可能性があるということです。クラスタリングが解決策になるかもしれませんが、MTL の観点からではなく、この問題に対処する他の方法について誰かが提案できることを本当に知りたいです。

4

1 に答える 1

0

入力が非常に「小さく」、出力が非常に大きい場合、それらの出力値の表現が異なると予想されます。それらがある種の線形または非線形の組み合わせであるかどうかを分析して、値自体ではなく「関数パラメーター」を推定することができます。例: 正規分布の加重和に「縮小」できる時系列を見積もったことがあるので、加重とパラメータを見積もる必要がありました。

最終的には、入力パラメーターが 6 つしかない場合、何らかの意味で (おそらく線形ではない) 6 から 12 次元の部分空間にしか到達しません。もちろん、それらは少し複雑になる可能性がありますが、800-dim スペースでの混乱を避けるために、結果のパラメーター化を実際に検討します。

そして、私が知っている機械学習がベクトルを生成するとコメントしたように。http://en.wikipedia.org/wiki/Bayes_estimator

于 2013-05-31T22:13:47.690 に答える