それぞれに特徴データの注釈が付けられた一連の例があります。例と機能は、任意のドメインでの実験の設定を説明しています (例: スイッチ数、実施日数、参加者数など)。一部の機能は固定 (静的) ですが、将来の実験で手動で設定できる機能 (可変) もあります。各例には「報酬」機能もあります。これは、専門家によって決定された実験の成功を示す、0 から 1 の間の連続した数値です。
この例セットに基づいて、将来の実験用の一連の静的機能が与えられた場合、報酬を最大化するために特定の変数に使用する最適な値をどのように決定すればよいでしょうか?
また、この工程に正式名称はありますか?私はいくつかの調査を行いましたが、これは回帰分析に似ているように聞こえますが、同じことかどうかはまだわかりません.