単純なベイジアン分類器を実装しましたが、それを大量のデータで使用するとオーバーフローの問題が発生します。
数値を小さく保ちながら正確に保つために私が試みた 1 つの戦略は、方程式のすべての部分の最大公約数で分子と分母を減らし続けることでした。ただし、これは、共通の約数がある場合にのみ機能します...
ほとんどの計算で分母と分子を分離しておくと、整数オーバーフローに苦労します。ほとんどの計算をオンザフライで実行し、二重算術を使用すると、さまざまな問題/制限に遭遇します。 (IEEE 754 で定義されているように) 非常に小さな double 値があります。
ここにいる何人かは以前にこのアルゴリズムを実装したことがあると思いますが、これらの問題にどのように対処しましたか? コストがかかりすぎるため、任意の精度の型を取り込まないことをお勧めします。それらを必要としないソリューションが存在すると確信しています。
ありがとう。