立ち往生している小さな問題があります。Python statsmodels を使用して多項ロジット モデルを構築しており、教科書に記載されている例を再現したいと考えています。ここまでは順調ですが、回帰の基準値として別の目標値を設定するのに苦労しています。誰か助けてくれませんか?!
import numpy as np
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
#import data
df = pd.read_excel('C:/.../diabetes.xlsx')
#split the data in dependent and independent variables
y = df['CC']
X = df.drop(['Patient', 'CC'], axis = 1)
Xc = sm.add_constant(X)
#instantiate and fit multinomial logit
mlogit = sm.MNLogit(y, Xc)
fmlogit = mlogit.fit()
print(fmlogit.summary())
したがって、列「CC」はターゲット変数であり、糖尿病ステータスのエンコンディングが含まれています。
CC = 1 -> 明らかな糖尿病、CC = 2 -> 化学的糖尿病、CC = 3 -> 正常
現在、デフォルトでは CC = 1 がベース値ですが、CC = 3 をベース値にしたいと考えています。これが私の回帰出力です。
誰か知っていますか?
事前にどうもありがとう、ig