0

こんにちは完全な初心者の質問: 2 つの列で構成されるテーブルがあります。最初の列は、ショウジョウバエが生息する場所によってコード化された「ビン」に属します。2 番目の列は、それぞれ 0 または 1 で、ニュートラル vs 本当に砂糖が好きです。2つ質問がありますか?

1) 単一の変数があると思われる場合、彼らが住んでいる場所に関する何かが、彼らが砂糖をどれだけ好きかを決定しています. コンピューターを 2 つのクラスターにグループ化する方法はありますか? 砂糖対ニュートラルが好きなすべてのビン。そうすれば、さらに実験を行って、ビンが何であるかを判断できます。

2) この動作を引き起こしている可能性のあるクラスターの数を自動的に判断しますか? たとえば、砂糖の好みの結果を決定できる 4 つの変数 (4 つのクラスター) があるとします。

これが些細なことである場合はお詫び申し上げます。以下に表を示します。ありがとう!

Bin sugar
1   1
1   1
1   0
1   0
2   1
2   0
2   0
3   1
3   0
3   1
3   1
4   1
4   1
4   1
5   1
5   0
5   1
6   0
6   0
6   0
7   0
7   1
7   1
8   1
8   0
8   1
9   1
9   0
9   0
9   0
10  0
10  0
10  0
11  1
11  1
11  1
12  0
12  0
12  0
12  0
13  0
13  0
13  1
13  0
13  0
14  0
14  0
14  0
14  0
15  1
15  0
15  0
16  1
16  1
17  1
17  1
18  0
18  1
18  1
17  1
19  1
20  1
20  0
20  0
20  1
21  0
21  0
21  1
21  0
22  1
22  0
22  1
22  1
23  1
23  1
24  1
24  0
25  0
25  1
25  0
26  1
26  1
27  1
27  1
4

1 に答える 1