D=(x,y), y=F(x) を考えると、ほとんどの機械学習方法は、y をラベルまたは実数値の単変量としてのみ出力するようです。しかし、最大 800 次元の多項分布ベクトルであるために y が必要なのに対し、x ベクトルは 5 ~ 9 次元しか持たないという状況に直面しています。これにより、問題が非常に難しくなります。
マルチタスクの機械学習方法で多くのことを調べました。そこでは、これらすべての y_i を同時にトレーニングできます。そしてもちろん、タスク間のつながりを考慮せずに、これらすべての次元を個別にトレーニングすることもできます。しかし問題は、多くの論文を検討した結果、ほとんどの MTL 実験では 10 ~ 30 のタスクしか処理できないように思われることです。つまり、800 のタスクはクレイジーでトレーニングに適していない可能性があるということです。クラスタリングが解決策になるかもしれませんが、MTL の観点からではなく、この問題に対処する他の方法について誰かが提案できることを本当に知りたいです。