2

立ち往生している小さな問題があります。Python statsmodels を使用して多項ロジット モデルを構築しており、教科書に記載されている例を再現したいと考えています。ここまでは順調ですが、回帰の基準値として別の目標値を設定するのに苦労しています。誰か助けてくれませんか?!

import numpy as np
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt

#import data
df = pd.read_excel('C:/.../diabetes.xlsx')

#split the data in dependent and independent variables
y = df['CC']
X = df.drop(['Patient', 'CC'], axis = 1)
Xc = sm.add_constant(X)

#instantiate and fit multinomial logit
mlogit = sm.MNLogit(y, Xc)
fmlogit = mlogit.fit()

print(fmlogit.summary())

したがって、列「CC」はターゲット変数であり、糖尿病ステータスのエンコンディングが含まれています。

CC = 1 -> 明らかな糖尿病、CC = 2 -> 化学的糖尿病、CC = 3 -> 正常

現在、デフォルトでは CC = 1 がベース値ですが、CC = 3 をベース値にしたいと考えています。これが私の回帰出力です。

誰か知っていますか?

事前にどうもありがとう、ig

4

0 に答える 0