scikit-learn - なぜscikitは対数密度を返すのですか?

Question

sklearn.neighbors.kde.KernelDensityの関数score_samplesは、密度のログを返します。それ自体の密度を返すことの利点は何ですか?

対数は、0 から 1 の間の確率に対して意味があることを知っています (この質問を参照してください: GaussianNB [scikit-learn] で対数確率推定を使用する理由は? ) しかし、0 から 1 の間の密度に対して同じことを行うのはなぜですか?無限？

対数密度を直接推定する方法はありますか、それとも推定密度から得られた対数ですか?

score 2 · Accepted Answer

確率に当てはまることの多くは密度にも当てはまるため、GaussianNB [scikit-learn] で対数確率推定を使用する理由の答えは? 申し込み：

密度がどこでも正である限り、対数は明確に定義されます。密度が 0 に近づくにつれて、数値分解能と安定性が大幅に向上します。特定の幅のガウスカーネルを想像して、ポイントをモデル化し、それらがどこかのクラスターにあると想像してください。この密集した領域から離れると、対数密度はクラスターまでの距離の二乗が負になります。その指数関数は、当然のことながらもはや信頼できない非常に少量の量をすぐに生み出します。

scikit-learn - なぜscikitは対数密度を返すのですか?

1 に答える 1

Related

Reference