1

私は機械学習やクラスタリングの経験があまりないので、この問題にどのようにアプローチすればよいか途方に暮れています。関心のあるデータは 4 つの列で構成され、そのうちの 1 つは単なる ID です。他の 3 つは数値データ、値 >= 0 を含みます。必要なクラスタリングは実際には非常に簡単で、手動で行うこともできますが、後でわかりにくくなるため、適切な種類のプロセスから始めたいと考えています。次のように、3 つの列 (A、B、C と呼びます) に依存する 6 つのクラスターが必要です。

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

この段階で、これらのクラスターはデータに洞察を与え、さらなる分析に役立ちます。

私はこれにまったく慣れていないので、クラスタリングを行うさまざまなアルゴリズムについてまだ十分に学んでいないため、どこから始めればよいかわかりません。誰かが使用する適切なモデル、または私が調査できるいくつかのモデルを提案できますか.

4

2 に答える 2

2

これは私にはクラスタリングのようには見えませ

代わりに、単純な決定木分類が必要だと思います。

Rapidminer ではすでに利用可能になっているはずです。

于 2012-10-24T15:52:11.613 に答える
0

「属性の生成」演算子を使用できます。

これにより、既存の属性から新しい属性が作成されます。

すべてのルールを作成するのは比較的面倒ですが、次のようになります。

クラスター:if(((A == 0)&&(B == 0)&&(C == 0))、1,0)

于 2012-10-25T20:15:04.183 に答える