私は機械学習やクラスタリングの経験があまりないので、この問題にどのようにアプローチすればよいか途方に暮れています。関心のあるデータは 4 つの列で構成され、そのうちの 1 つは単なる ID です。他の 3 つは数値データ、値 >= 0 を含みます。必要なクラスタリングは実際には非常に簡単で、手動で行うこともできますが、後でわかりにくくなるため、適切な種類のプロセスから始めたいと考えています。次のように、3 つの列 (A、B、C と呼びます) に依存する 6 つのクラスターが必要です。
A B C Cluster
---- ---- -------- -------
0 0 0 0
0 0 >0 1
0 >0 <=B 2
0 >0 >B 3
>0 any <=(A+B) 4
>0 any >(A+B) 5
この段階で、これらのクラスターはデータに洞察を与え、さらなる分析に役立ちます。
私はこれにまったく慣れていないので、クラスタリングを行うさまざまなアルゴリズムについてまだ十分に学んでいないため、どこから始めればよいかわかりません。誰かが使用する適切なモデル、または私が調査できるいくつかのモデルを提案できますか.