私はPython 2.7
Mac OSX Lionで使用しています。、およびパッケージで使用IPython
しています。Pandas 0.11.0
Numpy
Statsmodels
モデルの構築に使用する変数、ダミー変数に変換する変数、および独立変数にする変数を指定して、ユーザーがファイルに対してロジスティック回帰を実行できるようにする関数を作成しています。
たとえば、次のことを行うと:
cols_to_keep = []
print (df.columns)
i = eval(raw_input('How many of these variables would you like to use in logistic regression?: '))
while i != 0:
i = i - 1
print (df.columns)
addTo = raw_input('Enter a variable for this list that you would like to keep and use in logistic regression.: ')
cols_to_keep.append(addTo)
私は途中で問題に遭遇します。具体的には、ユーザーにリストから従属変数を指定するように依頼し、その変数をトレーニング変数のリストから取り出す必要がある場合:
print (df.columns)
dependent = raw_input('Which of these columns would you like to be the dependent variable?: ')
training.remove(dependent)
print ステートメントを挿入した後、トレーニング変数のリストに追加された変数が次のようになっていることがわかりました。
('these are the traing variables: ', ['access', u'age_age6574', u'age_age75plus', u'sex_male', u'stage_late', u'death_death'])
u
各ユーザー指定変数の前にaが配置されているようです。
私の質問は、ユーザーが従属変数を指定すると、実際にリストから削除されるように、これがなぜなのか、この問題をどのように修正/回避するのかということです。これは、ユーザーが変数を指定してリストに追加される他のすべてのインスタンスでも発生し、ユーザーがリストを観察する必要がある場合に混乱を招きます。