3

したがって、トレーニング セットがあり、属性の 1 つのドメインは次のとおりです。

A = {Type1, Type2, Type3, ... ,Type5}

ドメインがその形式のままである場合、数学的仮説が機能しない可能性があるため、線形回帰を適用できません。

H = TxA + T1xB + T2xC + ...

(つまり、A 属性を除くすべての属性が数値であると仮定すると、実数値パラメーターに type を乗算することはできません)

ドメインを数値、等価、離散値に置き換えて、この問題に対して線形回帰を実行して問題ないようにすることはできますか?

A = {1, 2, 3, ...., 5 )

これはベストプラクティスですか?そうでない場合は、そのような状況での代替案を教えてください。

4

2 に答える 2

0

通常、公称属性の平均は意味をなさないため、これは機能しません。たとえば、Apple = 1、Banana = 2、Orange = 3 を割り当てた場合、モデルでは Banana は Apple と Orange の平均として表示されます。分類タスクについては、パーセプトロン、ニューラル ネットワーク ( Winner-take-allパラダイムを使用すると、名義属性間の平均の問題が解消されます)、決定木、または言及し忘れたその他のツールの使用を検討してください。larsmansが正しく指摘したように、あなたのケースの典型的なモデルはLogistic Regressionです。

おそらく、線形回帰に WTA パラダイムを使用することもできます。出力ベクトルの各次元の回帰モデルを構築します。

明確化: WTA はlarsmans's answer のone-hot と同じです。

于 2013-10-22T08:53:37.727 に答える