機械学習タスク用の C4.5 分類子を検討しています。私は都市名を含む大規模なデータセットを持っており、ロンドン オンタリオ、ロンドン イングランド、またはフランスのブルゴーニュのロンドンなどを区別する必要がありますが、周囲のテキストから特徴を調べる必要があります: 例: 郵便番号、州名、たとえ「カナダ」または「イギリス」は言及されていません。また、国を特定するのに役立つダイヤルコードなどのメタデータにもアクセスできます。
その後、トレーニングが完了したら、大規模なデータセットで分類器を実行したいと考えています。
ここで見つけたすべての例で、結果には 2 つの状態しかありません (このゴルフの例では、プレーするかプレーしないか)。
c4.5 分類子は、ロンドン (カナダ)、ロンドン (イングランド)、ロンドン (フランス) を結果クラスとして処理できますか?それとも、ロンドン (カナダ) の True/False などに別の分類子が必要ですか?