1

私は、どの郡でどの大統領が勝利したかを正しく予測する機械学習データ サイエンス アルゴリズムを構築してトレーニングしようとしています。トレーニング データに関する次の情報があります。

総人口 年齢の中央値 % 学士号以上 失業率 1 人当たりの収入 世帯数 平均世帯人数 % 持ち家の占有率 借家の占有率 空き家 住宅価格の中央値 人口の増加 世帯の増加

私はデータサイエンスが初めてです。Naive Bayes は、複数のプロパティで予測しようとするアルゴリズムにとって優れた分類器であることを知っています。ただし、単純ベイズ分類器の最初のステップには頻度表が必要であると読みました。私の問題は、上記のすべてのプロパティが連続的な数値プロパティであり、「はい」または「いいえ」のカテゴリに分類されないことです。それでは、単純ベイズ分類器を使用しませんか?

ak 最近隣アルゴリズムの使用も検討しましたが、それが最も正確で、プロパティを正しく重み付けするようには見えません...トレーニングデータがあるため、教師ありアルゴリズムを探しています。どのアルゴリズムを使用するかについて、誰かが私に推奨事項を教えてもらえますか? さらに、この分野に不慣れなため、将来自分で使用するアルゴリズムをどのように見つければよいでしょうか。

4

2 に答える 2