これはおそらく、可能な分類アルゴリズムに関する初心者の質問なので、ご容赦ください。以下の例のように見える公称属性と数値属性の両方を含むデータセットがあります (実際のデータセットではありません)。クラスを述語して精度を得るには、どのようなアルゴリズムが最適でしょうか (できれば Python/Java で)。
Classes: classA, classB, classC
attribute1: Recurrence <Yes, No>
attribute2: Subject <Math, Science, Geography>
attribute3: ProbabilityA <0.0 - 1.0>
atrribute4: ProbabilityB <0.0 - 1.0>
attribute5: ProbabilityC <0.0 - 1.0>
公称データには [1,-1] の数値を含めることができます。ここで、1 は存在を表し、-1 は存在しないことを表します。または、['YES', 'NO'] または ['Type1', ['Type1', 「Type2」、「Type3」]。数値は、属性の可能性を表すために使用されます。たとえば [0-1] の場合、値が 1 に近いほど、true と評価される可能性が高くなります。