3 つの連続変数と 5 つの名義変数 (各変数に 5 つのカテゴリ) を持つ 1 つの結果変数 (はい/いいえ) を持つデータ ファイル (100 万行) があります。モデルを構築するのにどのタイプの分析が適しているかを知りたかったのです。ロジット、プロビット、ロジスティック回帰を見てきました。分析に役立つ可能性が高い変数を何から始めて分析するかについて、私は混乱しています。
データ ファイル: 性別、地域、年齢、会社、専門分野、職務、診断、ラボ、注文、ステータス
M、西、41、PA、FPC、アシスタント、code18、27、3、はい
M、サウスウェスト、65、CV、FPC、ワーカー、コード18、69、11、なし
M、南、27、DV、IMC、アシスタント、無効、62、13、いいえ
M、サウスウェスト、18、CV、IMC、ワーカー、コード8、6、1、はい
PS: R 言語を使用します。どんな助けでも大歓迎ですありがとう!