現在、サポート ベクター マシンを使用して、特定の人口統計データからユーザーが購入するアイテムを予測しています。データセットには、特定の年齢層のユーザーが各アイテムを購入した人数も含まれています。それは次のように見えました:
items a b c
age
15-20 10 3 10
20-25 1 5 6
25-30 2 5 6
これをトレーニング データに組み込む方法がわかりません。これを組み込む唯一の方法は、ユーザーがアイテムを購入する一連の確率値を含めることですが、これは非常に扱いにくいものです。私が持っていた別のアイデアは、アンサンブル学習法を使用し、svm を単純ベイズ分類器と組み合わせるというものでした。モデルを構築するためにsklearnを使用しています。