Python による離散選択分析。通常、回帰データを表すには 2 つの形式があります。
- ロングフォーマット
- ワイドフォーマット
長い形式には、考えられる各オプションの行と、選択に基づいて 0 または 1 の Y 列があります。ワイド フォーマットは、1 人 (調査回答者) につき 1 行のみであり、Y は選択されたすべての機能を理解し、X はすべての製品の選択肢を理解します。
長い例
person answer Y ~ x1 x2
1 1 0 green large
1 1 1 red large
1 2 1 green small
...
ワイド例
y1 y2 ~ x11 x12 x21 x22
green large green large red large
green small green small red small
...
- 私の説明は正しいですか?
- statsmodel mlogit は、ここで説明されているワイド フォーマットを使用しますか?