特定のイベントが発生するまで (限られた期間内に) 何日経過したかを示す変数を持つデータセットがあります。
そのイベントが(その期間内に)発生したことがないため、一部のレコードには null 値があります。
欠損値を処理するとき、アルゴリズムや平均値、中央値などで代入を使用することがあります。ただし、この種の null 値を処理する場合、私の直感では、これらの null 値を巨大な数に置き換えて、それらのレコードを使用する必要があります。これらのヌル値も情報を提供するため、モデル化します。
私の直感は正しいですか?