2

最近、私はスタンフォード大学の陽気な公開教室のビデオ講義をたくさん見ました。特に、教師なし機械学習に関する部分が私の注目を集めました。残念ながら、さらに面白くなる可能性がある場合は停止します。

基本的に、教師なしアルゴリズムによって離散行列を分類しようとしています。これらの行列には、同じ範囲の離散値が含まれているだけです。値が 1 ~ 3 の 20x15 行列が 1000 個あるとします。文献を読み始めたところですが、画像分類はより複雑で (カラー ヒストグラム)、私の場合はそこで行われていることを単純化したものだと感じています。

Machine LearningCluster Cran Task Viewsも調べましたが、実際の例をどこから始めればよいかわかりません。

だから私の質問は次のとおりです。どのパッケージ/アルゴリズムが、Rで遊んで問題に取り組み始めるのに適しているでしょうか?

編集: 不正確だった可能性があることに気付きました: 私の行列には個別の選択データが含まれているため、平均クラスタリングは (!) 正しい考えではない可能性があります。ベクトルと観察についてあなたが言ったことは理解していますが、時間の経過とともにいくつかの観察があるため、行列またはdata.framesを受け入れる関数を望んでいます。

EDIT2:カテゴリデータの教師なし分類に焦点を当てたパッケージ/関数の紹介が、今最も役立つものであることを認識しています。

4

3 に答える 3

0

... 教師なしアルゴリズムによる離散行列の分類

それらをクラスター化することを意味する必要があります。分類は通常、教師ありアルゴリズムによって行われます。

画像分類はより複雑で (カラー ヒストグラム)、私の場合はそこで行われることを単純化したものだと思います。

行列が何を表しているかを知らなければ、必要なアルゴリズムの種類を判断するのは困難です。しかし、出発点として、20*15 行列を平坦化して長さ 300 のベクトルを生成することから始めることもできます。そのようなベクトルの各要素は、クラスタリングの基礎となる特徴(または変数) になります。これは、リンク先のパッケージを含む ML パッケージがCluster機能する方法です。「マトリックスまたはデータ フレームの場合、各行は観測に対応し、各列は変数に対応します。」

于 2011-10-27T21:25:43.907 に答える
0

これまでのところdaisy、パッケージから、複数のモードのデータを処理するclusterことを指す引数「gower」をそれぞれ見つけました。Gower's similarity coefficientGower はかなり唯一の距離メトリックのようですが、それでもカテゴリ データで使用するために見つけたものです。

于 2011-10-28T20:19:01.207 に答える
-1

ここから始めたいと思うかもしれません:http://cran.r-project.org/web/views/MachineLearning.html

于 2011-10-27T21:34:33.630 に答える