3

私は機械学習の初心者です。私の問題は、学生の場所と興味のある分野に応じて学生の大学を選択する機械を作ることです。つまり、学生の住所と同じ都市にある大学を選択する必要があります。このタスクにパーセプトロン アルゴリズムを使用できるアルゴリズムの選択に混乱しています。

4

6 に答える 6

1

最初に必要なのは、ラベル付けされたデータセットです。

この問題は ML の問題に分解できるように思えますが、最初にトレーニングするための正例と負例のセットが必要です。

データセットの大きさは? どのような機能を利用できますか? これらの質問に答えたら、データの特徴に最適なアルゴリズムを選択できます。

于 2013-03-12T22:30:51.050 に答える
1

どの機械学習アルゴリズムがどのタスクに最適かについて、厳密なルールはありません。最善の策は、いくつか試してみて、どれが最良の結果を達成するかを確認することです. 多くの異なる機械学習アルゴリズムを実装するWeka ツールキットを使用できます。はい、問題にパーセプトロン アルゴリズムを使用できますが、それで良い結果が得られるとは限りません。

あなたの説明から、あなたが解決しようとしている問題は実際には機械学習を必要としないように思えます。学生が興味のある分野のコースを提供している最寄りの大学と学生を一致させたいだけの場合は、何も学習せずにこれを行うことができます。

于 2013-03-08T11:12:17.540 に答える
1

学生が大学と同じ地域に住んでいなければならない場合、おそらく機械学習は必要ないという最初の発言を支持します。ML アルゴリズムを使用する場合は、どのデータから開始する必要があるかを考えるのが最善でしょう。頭に浮かぶのは、特徴ごとに特定の科目/領域を持つ大学のベクトルです。次に、学生にとって理想的な特徴ベクトルのようなベクトルからの距離を計算します。この距離を最小限に抑えます。

于 2013-03-08T12:49:23.947 に答える
0

この問題には、一連の if else ルールに似た決定木を使用することをお勧めします。学生の場所と興味のある分野を if ステートメントと else if ステートメントの条件として取り、彼に大学を提案することができます。入力から出力への直接マッピングであるため、ルールベースのソリューションは機能し、ここで学習する必要はありません。

于 2015-04-28T10:12:39.440 に答える
0

さて、この質問に対する直接的で確実な答えはありません。答えは、いくつか例を挙げると、問題のステートメントと必要な出力の種類、データのタイプとサイズ、利用可能な計算時間、特徴の数、データ内の観察など、多くの要因によって異なります。

  1. トレーニング データのサイズ

  2. 出力の正確性および/または解釈可能性

モデルの精度とは、関数が特定のオブザベーションの応答値を予測することを意味します。これは、そのオブザベーションの真の応答値に近いものです。高度に解釈可能なアルゴリズム (線形回帰のような制限モデル) は、個々の予測子が応答にどのように関連付けられているかを簡単に理解できることを意味しますが、柔軟なモデルは解釈可能性が低いという犠牲を払ってより高い精度を提供します。

  1. 速度またはトレーニング時間

通常、精度が高いほど、トレーニング時間が長くなります。また、アルゴリズムは、大規模なトレーニング データでトレーニングするためにより多くの時間を必要とします。実際のアプリケーションでは、アルゴリズムの選択は主にこれら 2 つの要因によって決まります。

Naïve Bayes や Linear and Logistic 回帰などのアルゴリズムは、実装が簡単で、すぐに実行できます。パラメータの調整を伴う SVM のようなアルゴリズム、収束時間の長いニューラル ネットワーク、ランダム フォレストは、データのトレーニングに多くの時間を必要とします。

  1. 直線性

多くのアルゴリズムは、クラスが直線 (またはその高次元のアナログ) で区切られるという前提で動作します。例としては、ロジスティック回帰やサポート ベクター マシンなどがあります。線形回帰アルゴリズムは、データの傾向が直線に従うことを前提としています。データが線形の場合、これらのアルゴリズムは非常にうまく機能します。

  1. 特徴の数

データセットには、すべてが関連性があり、重要であるとは限らない多数の機能が含まれている場合があります。遺伝学やテキストなどの特定のタイプのデータでは、データ ポイントの数に比べて特徴の数が非常に多くなる場合があります。

于 2020-07-10T08:36:31.383 に答える