ソーシャル ネットワーキング ゲームのプレイヤー間でのマイニングのパターン化の問題に興味があります。たとえば、ある会社のユーザー データベースから、ゲームの不正行為者を検出します。これまでのところ、データ マイニング プロジェクトの通常のレシピに従ってきました。
- 重要な情報を集約するデータ ウェアハウスを構築する
- 分類子を選択し、倉庫からのレコードのサブセクションでトレーニングします
- 分類子を別のテスト セットで検証する
- 泡立てる、すすぐ、繰り返す
驚いたことに、文献やベスト プラクティスなどに関するこの分野の情報はほとんど見つかりませんでした。ここで情報収集の問題をクラウドソーシングしたいと考えています。特に私が探しているもの:
- このタイプのパターン マイニングでは、どのような分類子が機能したか (ユーザーがゲームをプレイしている、ユーザーが報酬を受け取っている、ユーザーが賞品を譲渡しているなど、非常に一時的なようです)。
- ソーシャル ネットワーキング/ゲーム データに固有の、高く評価されている属性はありますか?
- 考慮すべき実用的な情報量はどれくらいですか? 私が遭遇した問題の 1 つはデータの過負荷で、クエリとデータ クレンジングが完了するまでに数日かかる場合があります。
- 上記のポイントに関連して、結果を生成するにはどのようなハードウェア リソースが必要ですか? 本番環境で使用するために必要な計算能力の量を見積もるのは難しいと思います。隅にある白いボックスでは、このようなプロジェクトに十分な馬力がないことが明らかになりました。企業は一般的にクラウド ソリューションに頼っていますか? 彼らはクラスタを購入していますか?
基本的に、ソーシャルネットワーキング/ゲームパターンマイニングプログラムの実装に関するリソース (理論的、学術的、または実用的) は非常に高く評価されます。
ありがとう。