私は次のような機械学習の問題に取り組んでいます:
入力変数
Categorical
a
b
c
d
Continuous
e
出力変数
Discrete(Integers)
v
x
y
Continuous
z
私が直面している大きな問題は、出力変数が互いに完全に独立しているわけではなく、それらの間に確立できる関係がないということです。つまり、依存関係はありますが、因果関係によるものではありません(一方の値が高いということは、もう一方の値も高くなることを意味するわけではありませんが、他の値が高くなる可能性は高くなります)
例は次のとおりです。
v-広告の表示回数
x-広告クリック数
y-コンバージョン数
z-収益
現在、広告がクリックされるには、最初に検索に表示される必要があるため、クリックはインプレッションに多少依存します。
繰り返しになりますが、広告を変換するには、最初にクリックする必要があるため、変換はクリックに多少依存します。
したがって、各出力変数を予測する問題の4つのインスタンスを実行することは、私には意味がありません。実際、暗黙の依存関係を処理して、4つすべてを一緒に予測する方法があるはずです。
しかし、ご覧のとおり、直接的な関係はありません。実際、関与している可能性はありますが、手動で解決することはできません。
さらに、出力変数はカテゴリではありませんが、実際には離散および連続です。
この問題を解決する方法に関する入力。また、同じものの既存の実装と、ソリューションを迅速に実装するために使用するツールキットについても説明します。
ランダムな推測-この問題はベイジアンネットワークの対象になると思います。どう思いますか ?