Naive Bayes Classifier (NBC) に適していると思われる分類の問題に直面しています。ただし、問題が 1 つあります。通常、NBC は、確率変数 X の観測値 x に基づいて、クラス C のセットから最も可能性の高いクラス c を推定することによって機能します。
私の場合、機能を共有する場合と共有しない場合がある複数の変数 X1、X2 があります。変数 X1 は機能 (xa、xb、xc) を持つことができ、X2 は (xc、xd) を持つことができ、別の変数 X3 は (xe) を持つことができます。特徴が交差または直交しているにもかかわらず、X1、X2、および X3 を同時に分類できる 1 つの分類器を構築することは可能ですか?
この問題は別の観点から見ることができます。特定のクラスについて、特定の機能のすべてのデータが欠落しています。次の表を検討してください。
クラス = {C1,C2}。
機能 = X = {X1,X2,X3}、X1={A,B}、X2={1,2}、X3={Y,N}
クラス C1:
X1 X2 X3 #observations
A 1 ? 50
A 2 ? 20
B 1 ? 20
B 2 ? 10
クラス C2:
X1 X2 X3 #observations
A 1 Y 20
A 1 N 0
A 2 Y 20
A 2 N 10
B 1 Y 10
B 1 N 20
B 1 Y 10
B 1 N 10
ご覧のとおり、機能 X3 はクラス C1 とは何の関係もありません。クラス C1 を分類する機能 X3 のデータはありません。X=(A,2,N) を C1 と C2 の両方に分類する分類器を作成できますか? クラス C1 の X3 の欠落データの条件付き確率を計算するにはどうすればよいですか?