単純なSTRIPSベースのプランナーを作成しようとしています。目標に到達する個別の確率的計画を計算するための基本機能を完了しましたが、現在、最初のアクションに基づいてこれらの計画を集約する方法を決定し、時間t0での「全体的な」最良のアクションを決定しようとしています。 。
次の例を考えてみましょう。ユーティリティは、0から1の範囲で、計画が目標をどの程度達成しているかを表します。CFも0と1の間にあり、確実性係数、つまり計画を実行すると特定の効用が得られる確率を表します。
Plan1: CF=0.01, Utility=0.7
Plan2: CF=0.002, Utility=0.9
Plan3: CF=0.03, Utility=0.03
相互に排他的な3つのプランすべてが、アクションA1で始まる場合、アクションA1を使用するための全体的な「適合性」を判断するために、それらをどのように集約する必要がありますか?私の最初の考えは、確実性の要因を合計し、それをユーティリティの平均で乗算することです。それは正しいと思いますか?
したがって、現在の結果は次のようになります。
fitness(A1) = (0.01 + 0.002 + 0.03) * (0.7 + 0.9 + 0.03)/3. = 0.02282
または、個々の可能性のあるユーティリティを計算し、それらを平均する必要がありますか?
fitness(A1) = (0.01*0.7 + 0.002*0.9 + 0.03*0.03)/3. = 0.00323
より理論的に健全な方法はありますか?