情報利得の計算を理解している間 - 人口の癌の確率は 1% です。がんの検査では、がん患者は 50% の確率で、非がん患者は 99.5% の確率で正しく識別されます。さて、この癌検査で得られる情報利得を計算しなければなりませんか? これは、エントロピーと情報獲得を学びながら解決しようとしている演習問題の 1 つです。編集 - 上記を計算する私の試みは -
総人口を100とすると、
Cancer patient =1
Non-cancer patient = 99
Entropy H = -1/100 log(1/100)- 99/100 log(99/100)
がん患者のテストでは、50% ががん患者で、50% が非がん患者であることがわかりました。したがって、がん患者としての分類のエントロピー -
H1 = -1/2(log1/2)-1/2log(1/2)
非癌患者 99.5% の非癌患者と 0.5% の癌を与えます。したがって、情報は得られるはずです。非がん患者への分類のエントロピーは -
H2 = -(99.5*99/100)log(99.5*99/100) - (5/100)*99 log(5/100*99)
テスト後にエントロピーを取得する正しい方法を知りたいです。これが正しければ、情報利得を計算できます -
Information gain = H - (H1+H2)