1

オンラインで服を購入するときに、人々がモデルのどの機能を魅力的に感じるかについて予測学習を行うために、次のようなデータがあります。

というわけで以下のようなデータを持っています。

COLORofCLOTHING  MODELHAIR_COLOR MODEL_BUILD SELLER_CATEGORY
  Red               Black         Lean           1
  Blue              Brown         Lean           5
  Black             Blonde        Healthy        10

一連の属性が与えられた場合に、衣類が売れるかどうかを予測するため。ただし、売り手のカテゴリは 1 から 10 までの範囲 (1 が最高で 10 が最低) である可能性があります。この問題にどのように対処すればよいかわかりません。私はこの目的のためにwekaを使用しています。この問題に取り組む方法についてアイデアを教えてください。

基本的に、服の色などの特徴を学習し、服がどれだけ売れるかを予測できるモデルを構築したいと考えています。

4

1 に答える 1

2

データセットを次のように変換して正規化します。

 color_red   color_blue color_black  hair_black  hair_brown  hair_blonde ... prediction
 1           0          0            1           0           0           ... 0
 0           1          0            0           1           0           ... 0.5
 0           0          1            0           0           1           ... 1

ランダムフォレストとニューラルネットワークは、予測を提供できるはずです。

于 2012-12-21T04:40:41.850 に答える