1

私の質問は、私が抱えている特定の分類問題に関するものです。

トレーニング データは完全であり、欠損データはありません。その周りに任意の分類モデル (SVM、ランダム フォレストなど) を構築して、良い結果を得ることができます。これまでのところ、豚は対流圏を飛んでいません。

問題は、これらのモデルを機能が欠落しているデータに適用したいということです。私はいかなる種類の代入にも興味がありません。欠落している機能が増えるほど「不確実性」の測定値が高くなり、モデルが結果を吐き出すことを望みます(不確実性が高い場合でも)。たとえば、1 つのレコードについて、10 個のフィーチャのうち 5 個が空のデータである場合、モデルはクラスを提供しますが、不確実性は 50% です (理想的には、各変数がどの程度「重要」であるかを指定できます)。

私はオンラインで似たようなものに出くわしたことがなく、しばらく探していました. ご協力いただきありがとうございます !

4

1 に答える 1