いくつかのリアルタイム データにナイーブ ベイズ アルゴリズムを実装しようとしています。ベイズのルールは認識していますが、データに実装する方法がわかりません。データは次のようになります。データには合計 2 つのラベルがあり、問題ありません、詐欺、テスト データは unkn とラベル付けされています。ナイーブ ベイズ アルゴリズムを適用して、すべての unkn レコードを問題なしまたは詐欺として分類する必要があります。これを達成するにはどうすればよいですか? 誰か助けてください。
1,v1,p1,182,1665,unkn
2,v2,p1,3072,8780,ok
3,v3,p1,20393,76990,ok
4,v4,p1,112,1100,fraud
5,v3,p1,6164,20260,unkn
6,v5,p2,104,1155,ok
7,v6,p2,350,5680,unkn
8,v7,p2,200,4010,ok
9,v8,p2,233,2855,unkn
10,v9,p2,118,1175,unkn
ベイズ ルール:-
unkn が OK である事後確率 = ok の事前確率 * 与えられた unkn が ok である可能性。
unkn が詐欺である事後確率 = 詐欺の事前確率 * unkn が与えられた詐欺の可能性。