8

ここで機械学習に関する質問をいくつか見たので、関連する質問を投稿することにしました。前菜、デザート、飲み物を含むランダムに生成された食品リストがあるとします。例としては、チキン、チーズケーキ、オレンジ ジュースなどがあります。ユーザーは、この組み合わせが個人的にどの程度好きかを 1 から 5 のスケールでランク付けします。リーチ評価の後、別のランダムな食べ物のセットが表示されます。

私の質問は、ユーザーが以前のすべてのデータからランダムに生成されたセットをランク付けするものを予測するために、どの機械学習手法/アルゴリズムを使用するかということです。本質的に、彼らの意見を使用して、新しい食品セットの評価を予測します。役に立ちそうなサイトや本はありますか?

4

7 に答える 7

3

連続する数値を予測しようとしているため、回帰問題を述べました。

データ インスタンスごとに、特徴を抽出し、値 (1 ~ 5) を関連付けることができます。機能は、食事中の料理の存在 (例: has_cheesecake、has_orange_juice) であり、各機能はブール値です。N 個の可能な料理があるとします。次に、各食事は、N 個の特徴と関連する値を持つデータ インスタンス (特徴ベクトルとも呼ばれます) です。以下は N=12 の例で、最後の (13 番目) 列が値です。

0 0 0 1 1 0 0 0 1 0 0 0 5
1 0 0 1 0 1 0 0 0 0 0 0 3
0 0 0 0 0 0 1 1 0 0 0 1 4

これを Weka などの機械学習プログラムにフィードすると、回帰モデルが作成されます。次に、新しい食事に対するユーザーのランキングを予測する場合は、次のように、最後の列が不明な新しいベクトルをフィードします。

0 0 1 0 0 0 1 0 0 0 0 1 ?

ソフトウェアは 3.9 のような値を返します。

于 2012-11-20T00:01:06.590 に答える
2

あなたが求めているのは基本的に感情検出です。これは、製品に対するユーザーの態度を予測するなどのことを行うために非常に人気があります。これは、あなたの学問的傾向に応じて、影響力のある論文です。

これを回帰問題と見なすこともできますが、多くの場合、人々はクラス間に順序関係があるという事実を無視しています。名前以外に食事の項目に関する情報がない場合は、うまくやれるとは思えません。値を予測する能力を向上させるために、可能であればコースの機能表現を探す必要があります。

于 2012-11-20T11:54:31.810 に答える
1

通常、これは最小化または最大化の問題であるため、オペレーション リサーチを検討します。

于 2012-11-19T21:32:44.700 に答える
1

最適な分類子を選択するには、属性値のおおよその数 (つまり、選択する前菜、デザート、飲み物の数) やトレーニング例のおおよその数など、推定する必要がある問題の追加の特性がいくつかあります。予測を行う前に提供しますか。すべての分類子がまばらなデータの処理に適しているわけではありません。

(属性値の数に比べて) 多数のトレーニング例がある場合は、決定木分類子を開始するのに適しています。デシジョン ツリーの利点の 1 つは、学習したツリーの構造が直感的であり、重要な属性 (および属性の組み合わせ) を簡単に解釈できることです。

于 2012-11-20T14:55:33.137 に答える
1

問題に適合するアルゴリズムは多数あります。その中には、決定木ニューラル ネットサポート ベクター マシンなどがあります。

ただし、ユーザーの意見を扱っている場合、場合によっては、すべての製品でユーザーの意見が得られないことがあります (スキップされる可能性があります)。これがあなたの場合かどうかはわかりませんが、すべての製品をランク付けするように強制しているのかもしれません。ただし、スキップするオプションをユーザーに与えると、ラベルが付けられていない製品がいくつか表示されることになります。そのような状況では、協調フィルタリングを使用できます。この方法は、私が説明した状況でも、新しいユーザーの推定選択を予測します。

Ng のコースで優れたチュートリアルを見つけることができます。

于 2015-12-25T09:43:19.387 に答える
1

優先度列である分類列があるので、決定木を試すことができます。

于 2012-11-19T23:36:45.240 に答える