入力スペースが(1,2、.... 999)の場合。そして、私は10の概念を持つ概念クラスCを持っています:C0、C1、C2...C9。
入力が与えられた場合、その入力に数字iが含まれている場合、その入力はciの要素です。たとえば、123という数字はc1とc2とc3の要素です。
この概念クラスCのVC次元は何ですか?
入力スペースが(1,2、.... 999)の場合。そして、私は10の概念を持つ概念クラスCを持っています:C0、C1、C2...C9。
入力が与えられた場合、その入力に数字iが含まれている場合、その入力はciの要素です。たとえば、123という数字はc1とc2とc3の要素です。
この概念クラスCのVC次元は何ですか?
ここにソリューション全体を投稿したくはありませんが、ここに何かがあります...
VC 次元を見つけるには、C によって粉砕できる入力空間内の点のセットを見つける必要があります。
C で粉砕できる 3 つのポイントのセット (14、24、3) を簡単に見つけることができます。
C で粉砕できる 4 つの点のセットを見つけるのは難しいですが、(157, 256, 367, 4) は機能します。
C によって打ち砕かれる5つの点を見つけるのは非常に困難です。これは、C の VC 次元 (入力空間が与えられた場合) が 4 であることを強く示唆しています。壊れやすいポイント。
実際、質問にはいくつかのあいまいさがあるかもしれません。それは、概念クラスが一連のポイントを「正しく分類」できるかどうかに依存します。つまり、C1 は (1, 2) を正しく分類しますか? ここで、1 には負のクラス ラベルが与えられ、2 には正のクラス ラベルが与えられます (正しく分割されているため)、または C2 だけがそれを行うことができますか? 問題はその方が少し興味深いので、私はそれができると思いました。
この答えは本当に正しいですか?
粉砕とは、選択した一連のデータポイントに対して、たとえば. (14,24,3)、可能なすべてのラベリングに対して、そのラベリングと一致するセット内の概念が存在します。
しかし、与えられた例 (14,24,3) を考えてみましょう。これら 3 つのポイントのすべての可能な true/false ラベル付けのリストと、どのクラスがそれらと一致しているかを以下に示します。
0 0 0 C_5、C_6、C_7、C_8、C_9、C_0 すべてこれと一致
0 0 1 C_3 のみ (3 番目の数値が 3 であり、クラス C_3 のみがそれを含むため)
0 1 0 C_2 と C_4 (「24」には 2 と 4 が含まれるため)
0 1 1 C_2、C_4、C_3
1 0 0 C_1 と C_4
1 0 1 一貫性のないクラス ("14" と "3" は数字を共有していないため)
1 1 0 C_4 ("14" と "24" には 4 が含まれているため)
1 1 1 一貫性のないクラス
したがって、クラス セットはこのデータ セットを粉砕しません。(または、定義の何かを誤解していますか?)