遺伝的プログラム (gp) を使用して、「イベント」からの「結果」の確率を推定したいと考えています。nn をトレーニングするために、遺伝的アルゴリズムを使用しています。
したがって、私のデータベースには多くのイベントがあり、各イベントには多くの可能な結果が含まれています。
各イベントの各結果に関連する一連の入力変数を gp に与えます。
私の質問は - gp のフィットネス関数はどうあるべきですか????
たとえば、現在、gp に一連の入力データ (結果入力変数) と一連のターゲット データ (結果 DID が発生した場合は 1、結果 DID が発生しなかった場合は 0、フィットネス関数は平均二乗) を与えています。出力とターゲットのエラー)。次に、各結果の各出力の合計を取り、各出力を合計で割ります (確率を求めるため)。ただし、これが正しい方法ではないことは確かです。
明確にするために、これは私が現在これを行っている方法です:
イベントで発生する 5 つの異なる結果の確率を推定したいと思います。
Outcome 1 - inputs = [0.1, 0.2, 0.1, 0.4]
Outcome 1 - inputs = [0.1, 0.3, 0.1, 0.3]
Outcome 1 - inputs = [0.5, 0.6, 0.2, 0.1]
Outcome 1 - inputs = [0.9, 0.2, 0.1, 0.3]
Outcome 1 - inputs = [0.9, 0.2, 0.9, 0.2]
次に、各入力の gp 出力を計算します。
Outcome 1 - output = 0.1
Outcome 1 - output = 0.7
Outcome 1 - output = 0.2
Outcome 1 - output = 0.4
Outcome 1 - output = 0.4
このイベントの各結果の出力の合計は、1.80 になります。次に、出力を合計で割って、各結果の「確率」を計算します。
Outcome 1 - p = 0.055
Outcome 1 - p = 0.388
Outcome 1 - p = 0.111
Outcome 1 - p = 0.222
Outcome 1 - p = 0.222
始める前に - これらは実際の確率ではなく、このアプローチはうまくいかないことを私は知っています!! 私が何を達成しようとしているのかを理解してもらうために、ここにこれを載せました。
各結果の確率を推定する方法について、誰かが私にいくつかの指針を与えることができますか? (また、私の数学はあまり得意ではないことに注意してください)
どうもありがとう