学習データセットとして、1,000 万件の製品 (タイトル、説明、ブランド、カテゴリ) のデータベースがあります。カテゴリを持たない約 10,000 個の製品を分類するアルゴリズムを作成したいと考えています。
Naive Bayes 分類器を使用してアルゴリズムをトレーニングするための小さな Java プログラムを作成しましたが、10,000 個の製品を入力すると、正解の 30% しか得られません....
これを改善する方法はありますか?
ありがとうございました。
学習データセットとして、1,000 万件の製品 (タイトル、説明、ブランド、カテゴリ) のデータベースがあります。カテゴリを持たない約 10,000 個の製品を分類するアルゴリズムを作成したいと考えています。
Naive Bayes 分類器を使用してアルゴリズムをトレーニングするための小さな Java プログラムを作成しましたが、10,000 個の製品を入力すると、正解の 30% しか得られません....
これを改善する方法はありますか?
ありがとうございました。