こんにちは完全な初心者の質問: 2 つの列で構成されるテーブルがあります。最初の列は、ショウジョウバエが生息する場所によってコード化された「ビン」に属します。2 番目の列は、それぞれ 0 または 1 で、ニュートラル vs 本当に砂糖が好きです。2つ質問がありますか?
1) 単一の変数があると思われる場合、彼らが住んでいる場所に関する何かが、彼らが砂糖をどれだけ好きかを決定しています. コンピューターを 2 つのクラスターにグループ化する方法はありますか? 砂糖対ニュートラルが好きなすべてのビン。そうすれば、さらに実験を行って、ビンが何であるかを判断できます。
2) この動作を引き起こしている可能性のあるクラスターの数を自動的に判断しますか? たとえば、砂糖の好みの結果を決定できる 4 つの変数 (4 つのクラスター) があるとします。
これが些細なことである場合はお詫び申し上げます。以下に表を示します。ありがとう!
Bin sugar
1 1
1 1
1 0
1 0
2 1
2 0
2 0
3 1
3 0
3 1
3 1
4 1
4 1
4 1
5 1
5 0
5 1
6 0
6 0
6 0
7 0
7 1
7 1
8 1
8 0
8 1
9 1
9 0
9 0
9 0
10 0
10 0
10 0
11 1
11 1
11 1
12 0
12 0
12 0
12 0
13 0
13 0
13 1
13 0
13 0
14 0
14 0
14 0
14 0
15 1
15 0
15 0
16 1
16 1
17 1
17 1
18 0
18 1
18 1
17 1
19 1
20 1
20 0
20 0
20 1
21 0
21 0
21 1
21 0
22 1
22 0
22 1
22 1
23 1
23 1
24 1
24 0
25 0
25 1
25 0
26 1
26 1
27 1
27 1