簡単な分類問題を解こうとしています。
問題:
テキストのセットがあり、コンテンツに基づいてそれらを分類する必要があります。
Mahout を使用したソリューション:
モデルを生成するには、入力をシーケンス ファイルに変換する必要があることを理解しました。はい、できました。では、テスト データをどのように分類すればよいでしょうか。20News の例では、正確性のみをテストしています。しかし、私は実際の分類をしたいです。
コードを書く必要があるのか、テスト セットを分類するために利用可能な既存のクラスを使用する必要があるのか わかりません。