0

私は機械学習が初めてで、この基本的な質問があります。私はアルゴリズムの数学の部分が苦手なので、これを理解するのは難しいと思います。

教師なし学習 (トレーニング サンプルなし) を使用して分類器を設計するタスクが与えられた場合 (単純にしてください -- 2 クラス分類器)、どのタイプの分類器 (線形または非線形) を使用するかを決定する方法は? これがわからない場合、特徴選択の重要性 (つまり、データ セットが何であるかを間接的に知ること) が非常に重要になります。私は正しい方向に考えていますか、それとも私が知らない大きな何かがあります. このトピックへの洞察は大歓迎です。

4

2 に答える 2

1

分類は、定義上、「教師あり学習」の問題です。このようなモデルでは、クラスを互いに分離する方法を理解するために、特定のクラス内のポイントの例が必要です。ラベル付けされていないデータ ポイント間の関係を単に探している場合は、教師なし問題を解決しています。クラスタリング アルゴリズムを調べます。k-meansは、多くの人が始めるところです。

お役に立てれば!

于 2013-10-31T22:51:05.283 に答える
0

これは大きな問題です。はい、「クラスタリング」という用語は、それについてグーグルで検索するための最良のエントリポイントですが、「トレーニング」とはパラメーターを使用して目的関数を最適化することを意味する分類器をトレーニングしたいことを理解しています。最初の選択肢は、識別可能な分類器 (線形分類器など) ではありません。これは、標準の最尤 (ML) 目標がラベルなしでは機能しないためです。絶対に線形分類器を使用したい場合は、ML の目的を微調整するか、別の目的を使用する必要があります (分類器のリスクを概算します)。しかし、より簡単な選択は、HMM、ナイーブ ベイズ、潜在的ディリクレ配分など、ラベルなしで ML 目標が機能する生成モデルを調べることです。

于 2014-09-10T08:17:34.690 に答える