3

そんなこと知ってる:

  1. 教師なし学習は、 ラベルのないデータに隠された構造を見つけようとする学習です。それ以外の場合、教師あり学習と呼びます。
  2. 回帰も分類の一種ですが、その出力は無限の数値です。
  3. また、分類が教師あり学習の一種であることも知っています。

しかし、私を混乱させるのは:

  1. 線形回帰(ラインフィッティング)は回帰の一種ですか? もしそうなら、なぜそのデータはラベル付けされていないのですか?たとえば、そのサンプル データは (1,2)、(2,3)、(1,4) のような単なる座標の量ですか?
  2. ロジスティック回帰 (分類) は回帰の一種ですか?もしそうなら、なぜその出力は正常値 (値、偽、0 または 1 の真) なのですか?

誰でも私がこれを理解するのを助けることができますか?

4

4 に答える 4

14

1)データには入力と出力の両方が含まれているため、線形回帰は監視されています(つまり)。たとえば、ディーラーでの車の販売に関するデータセットがあるとします。車ごとに、メーカー、モデル、価格、色、割引などがありますが各車の販売台数を持っています。このタスクが監視されていない場合、メーカー、モデル、価格、色など (実際の販売数ではない) だけを含むデータセットが得られ、最善の方法はデータをクラスター化することです。この例は完璧ではありませんが、全体像を把握することを目的としています。メソッドが監視されているかどうかを判断するときに自問する良い質問は、「入力の品質を判断する方法はありますか?」ということです。線形回帰データがあれば、間違いなく可能です。入力データの関数 (この場合は線) の値を評価して、出力を推定するだけです。他の場合はそうではありません。

2) ロジスティック回帰は、実際には回帰ではありません。この名前は誤解を招きやすく、実際に多くの混乱を招きます。通常、バイナリ予測にのみ使用されるため、分類タスクには最適ですが、それ以外には使用されません。

于 2014-03-15T03:39:23.223 に答える
5

線形回帰は監視されます。既知の従属変数 (ラベル) を持つデータセットから開始し、モデルをトレーニングしてから、後で適用します。家の価格など、実数を予測しようとしています。

ロジスティック回帰も監視されます。その名前にもかかわらず、回帰手法というよりも分類器です。誰かが死ぬ確率など、クラス メンバーシップの確率比を予測しようとしています。

教師なし学習の例には、クラスタリングと関連分析が含まれます。

于 2014-03-15T03:41:40.157 に答える