1

いくつかの変数が 10 を超えるカテゴリ (いくつかの序数/いくつかの名義) を持つデータセットを受信して​​います。いくつかのカテゴリをマージして、プレゼンテーションを簡単にするだけでなく、分析に十分なイベントを取得できるのではないかと考えています。これはアプリオリな知識で行うことができます/行う必要がありますが、プロセスを簡素化するアルゴリズムは大歓迎です。そのようなアルゴリズムは存在しますか?これはRで実装されていますか?

編集:

data("GBSG2", package = "ipred")
cut(GBSG2$tsize,seq(0,100,10))->GBSG2$size

ここで、GBSG2$cens ステータスを予測する能力において、情報を大幅に失うことなく、GBSG2$size または GBSG2$tgrade のいずれかのカテゴリと、どのカテゴリをマージできるかを調べたいと思います。2 つの変数のいくつかのカテゴリをマージし、ロジスティック回帰を実行し、変数を手動でマージする前後の結果を比較することで手動で実行できることはわかっていますが、他の方法はありますか?

4

0 に答える 0