Cox モデルを構築および検証するための 2 つのデータ セット (トレーニングと検証) があります。
トレーニング データ セットを使用して、段階的選択法を使用して cox モデルを適合させました。
モデルの重要な変数は、検証モデルに含まれる唯一の変数です。これは正しいアプローチですか?
モデルを検証しているときに、検証モデルでは変数が重要ではなく、cox モデルの仮定も成り立たないことに気付きました (検証データの仮定を確認しました)。変数が重要ではないという事実を無視して、検証データのモデルの仮定に関する問題を修正する必要がありますか?
第三に、トレーニング データと検証データの両方で、3 つのグループを持つ変数「処理」があります。トレーニングでは、グループは標準、新薬、および混合物ですが、検証データでは、グループは標準、新薬、および X (トレーニング データでは混合物とは異なる治療法です) です。この変数を両方のモデルに含めるのは正しいですか、それとも一致しないグループを除外する必要がありますか? トレーニング データからの混合物と検証データからの X の混合物、またはそのように使用する必要がありますか? これが私の分析にどのように影響するかはわかりません。
ご回答ありがとうございます。