stat stack exchangeに質問を投稿しましたが、残念ながら今のところ回答が得られていないため、ここにコピーして誰かが助けてくれることを願っています.
私は機械学習の初心者です。最近、私はこれについて何かを学ぼうとしましたが、次の懸念がありました。
カテゴリ別に分類された製品があります。また、性別とデバイスのモデル情報を持つユーザーがいます。
まず、カテゴリと性別+デバイス情報が関連付けられているかどうかを調べるカイ二乗検定を行いました。たとえば、私の p 値は 0.000012 なので、ユーザー (性別 + デバイス) がカテゴリに関連付けられていると述べました。
したがって、新しいユーザーが性別 (女性) + デバイス (iPhone) を持っている場合:
カイ二乗検定の結果として、性別 + デバイスとカテゴリの間に関連性があるはずです。というわけで、iPhoneを使っている女性が消費した上位10のカテゴリーを選んでみました。リストを取得しました。たとえば、[1. ファッション、2.モバイル機器、3.カメラ、4.家具、5.自転車など]
また、カテゴリに対して (ユーザー情報なしで) Z テストを行い、リストを取得しました (Z スコアが高いほど上に表示されます)。モバイル デバイス、2. 自転車、3. ファッション、4. ラップトップなど]
この場合、そのユーザーにどのリストを提供すればよいでしょうか? またはそれらを組み合わせる可能性はありますか?それとも私は何か間違ったことをしましたか?
前もって感謝します :-)