ロジスティック回帰式の導出における最小値の背後にある考え方を誤解しています。
アイデアは、仮説を可能な限り大きくすることです (つまり、正しい予測確率を可能な限り 1 に近づけます)。そのためには、コスト関数 $J(\theta)$ を可能な限り最小化する必要があります。
これがすべて機能するためには、コスト関数が凸状でなければならないと言われました。凸性についての私の理解では、最大値が存在しない必要があるため、最小値は 1 つだけであり、グローバル最小値です。これは本当にそうですか?そうでない場合は、理由を説明してください。また、そうでない場合は、コスト関数に複数の最小値が存在する可能性があることを意味し、複数のパラメーターのセットがますます高い確率をもたらすことを意味します。これは可能ですか?または、返されたパラメーターがグローバル最小値を参照しているため、最高の確率/予測を参照していると確信できますか?