100 人の回答者が回答した 20 の多肢選択問題 (A/B/C/D) からなる一連のトレーニング データがあります。答えは純粋にカテゴリーであり、数値にスケーリングすることはできません。これらの回答者のうち 50 人が無料の製品トライアルに選ばれました。選考過程は不明。この情報からどのような興味深い知識を引き出すことができますか?
以下は、これまでに思いついたもののリストです-
- パーセンテージの調査 (例 - Q.5 で B と回答し、製品の無料トライアルに選ばれた人の割合)
- 条件付き確率 (例 - Qs.5 で B と答えた人が無料の製品トライアルに選ばれる確率は?)
- Naive Bayesian classifier (これは、質問のサブセットの特定の値のセットに対して人が選択されるかどうかを予測するために使用できます)。
他に実行できる興味深い分析やデータマイニング活動はありますか?
応答は定量化/スコア化できないため、相関関係などの通常の疑いは排除できます。
私のアプローチは正しいですか?