0

私のプロジェクトは次のようになります。私のデータセットは、boolean の hasJob や int healthScore などのさまざまな属性とその収入を持つ人々のプロファイルの集まりです。このデータを使って、彼らの将来の収入を予測しようとしています。各プロファイルには、過去の属性や収入などの履歴もあります。

つまり、本質的に、(x ブール値、y 数値) の複数のセットを数値 (来年の給与) にマップしようとしています。

関数フィッティングには、ニューラル ネットワーク、ベイズ ネット、および遺伝的アルゴリズムを検討しました。提案や入力はありますか?

前もって感謝します!--エミリー

4

1 に答える 1

1

やりたいことは「時系列モデリング」と呼ばれるものです。ただし、シリーズごと (1 人あたり) のデータはおそらくごくわずかです。誰もが同じようにキャリア志向であるなどの一般的な前提があるため、すべての人に適合する 1 つのモデルを見つけるのは難しいと思います。また、これは非常に騒々しいターゲットです。たとえば、誰かが甘い話者であるかどうかを考慮する必要があるかもしれません。そんなものどうやって測るの?あなたの現在の属性には、何かを予測するのを困難にする十分なノイズがあると確信しています. 健康状態とは、身体の健康のみを意味するのか、それとも精神の健康を意味するのか。異なるビジネスでは、異なることが重要です。彼らが働いているビジネスや業界はどうですか?その健康と成長の可能性は?これは彼らの収入に大きく影響すると思います。また、従属変数と属性がターゲット変数の影響を受ける可能性がある (そして影響を受ける可能性が高い) と思います。例)収入が高い人ほど健康です。非常に複雑で難しいことのように聞こえますが、「単純にデータをグループ化し、多くの方法を試した」ということは間違いありません。意味のある結果。時系列モデリング、特にあなたが持っているデータについてもっと学ぶことをお勧めします。たぶん、最初の属性によって人をクラスタリングすることから始めて、彼らがどのように成長するかを見てみてください. この展開に関連する変数はありますか?

あなたのリサーチクエスチョンは何ですか?

于 2012-10-06T08:31:30.483 に答える