0

この問題にどのようにアプローチすればよいかわかりません:

私はデータセットを持っています。ユーザーは、資金提供されたスキームの一部である場合とそうでない場合があります。機械学習を使用して、スキームの一部ではないユーザーが特定の条件 (1、2、3、および 4 など) の影響を受けやすいと推測したいと考えています。スキーム内のユーザーは、1、2、および 4 の影響を受けやすくなっています。したがって、次のように推測できます。スキームの一部である場合は、条件 3 の影響を受けません。

2番目に関連する問題もあります。資金提供スキーム内で、ユーザーは 2 つのプランを持つことができます (異なる金額の費用がかかります)。安いプランの方が高いプランの方に比べて、より多くの条件に影響を受けやすいかどうかを確認したいと思います.

これが推奨事項なのか分類の問題なのか、またどの特定のアルゴリズムを調べるべきかについて、誰か助けてもらえますか?

ありがとう。

4

2 に答える 2

1

ない。統計の問題です。データセットは完全であり、将来のサブジェクトまたはスキームの属性を予測する必要性について言及していないため、分類子またはレコメンダーをトレーニングしても、通常の目標には役立たないようです。

個人の状態を特徴として使用し、スキームの統計をターゲットとして使用し、SVM で分類してから、分類のパフォーマンス/精度をクラスの分離性の尺度として使用できます。クラスタリングも検討できます。ただし、t 検定は同じことを行い、このような主張の有効性を正当化するためのはるかに受け入れられたツールです。

于 2012-05-19T20:44:49.397 に答える