1

私のデータは次のようなオブジェクトで構成されています。

Obj1 - 色 - 形 - サイズ - 価格 - ランキング

そこで、色・形・サイズ・価格のどの組み合わせが上位を獲得するのに適しているかを予測できるようにしたいと考えています。または、たとえば次のような組み合わせでも機能します。良いランキングを得るために、alg はこの色とこの形状の最高のパフォーマンスを予測します。そんな感じ。

このような予測に適したアルゴリズムは何ですか?

また、モデル構築に向けてどのようにアプローチできるかを簡単に説明していただければ幸いです。たとえば、私のデータは次のようになります

Blue pentagon small $50.00 #5
Red  Squre    large $30.00 #3

では、注目すべき有用な予測モデルとは何でしょうか? 最高の重みは価格、色、サイズの順であると言うように、どのアルゴリズムを予測しようとすべきでしょうか。赤の小形はピンクの小形に比べて上位に入る可能性が低いような組み合わせで予測したい場合はどうでしょうか。(本質的に、予測を行うために複数の公称値列を組み合わせようとしています)

4

2 に答える 2

2

人間として解釈できるモデルを学びたいようですね。ランキング変数のタイプに応じて、さまざまな学習者が可能です。

ランク付けがカテゴリ (星など) の場合は、おそらく分類器が最適です。Wekaにはたくさんあります。人間が理解できるモデルを生成するのは、J48決定木学習者とOneRルール学習者です。

ランキングが連続している場合 (スコアなど)、回帰の方が適している可能性があります。適切なアルゴリズムは、たとえばSimpleLogisticおよびLinearRegressionです。

または、サンプルを Weka の任意のアルゴリズムでクラスタリングしてから、クラスタを分析することもできます。つまり、理想的には、クラスター内の例はすべて同じ (または非常に類似した) ランキングであり、他の属性の値の範囲を見て、独自の結論を導き出すことができます。

于 2012-12-19T04:31:41.760 に答える
0

組み合わせを線形方程式として扱い、モンテカルロ アルゴリズム (遺伝的アルゴリズムなど) を適用して方程式のパラメーターを調整します。


  1. 色・形・サイズ・価格・ランキングをデジタル値にコード化。

  2. 組み合わせを一次方程式として扱いますa*color + b*shape + c*size + d*price = ranking

  3. 遺伝的アルゴリズムを適用してa/b/c/d を調整し、計算rankings結果を可能な限りグラウンド トゥルースに近づけます。

  4. 最後に、式を取得しました。これを使用して、次のことができます。

    1)単純な線形計画によって最大のランキングを見つけます。

    2)他のパラメーターを割り当てるだけでランキングを予測します。

于 2012-12-19T04:30:19.113 に答える