15

モデルにカテゴリ変数が渡されると、statsmodels fitカテゴリに対してダミー変数が自動的に生成されることを理解してください。たとえば、値が「IndianOcean」、「Thailand」、「China」、「Mars」の変数「Location」がある場合、フォームのモデルで変数を取得します

Location[T.Thailand]

値の 1 つが表されていません。デフォルトでは、除外された変数は最も一般的ではないようです。理想的にはモデル仕様内で、どの値を「ベース値」として扱い、除外するかを指定する方法はありますか?

4

3 に答える 3

29

reference次のような構文を使用して、Treatment コントラストに引数を渡すことができます。

"y ~ C(Location, Treatment(reference='China'))"

http://patsy.readthedocs.org/en/latest/API-reference.html#patsy.Treatment

命名規則についてより良い提案がある場合は、patsy に問題を報告してください。

于 2014-03-16T16:53:36.087 に答える