最近、データマイニングと機械学習の分野に興味を持っています。膨大なデータセットを調べて、隠れたパターンと傾向を関連付けようとするアイデアは魅力的です。これまでのところ、次のことを行っています
- Weka を使用して単純なデータセットを読み込み、決定木を生成しました
- 本、ウィキ、ブログ、SO を同じ場所で継続的に読む
- SQL Server DM と Python API をいじり始めました
- ウェブ上で自由に利用できるデータセット (freedb、UN など) のオプションについてアイデアを持っている
私を妨げているのは、分類/関連付けを超えて先験的/アプリオリなアルゴリズムに入ろうとする分です。数学の方程式と論理を理解することは(控えめに言っても)私の強みの1つではないため、立ち往生しています。
ですから、私の質問は、データ マイニングの分野で (プロダクト オーナーまたはビルダーの役割で) 生まれつき数学者ではない人がいますか? もしそうなら、Weka や Rapid-miner のような無料のツールはどちらも数学/統計のバックグラウンドを期待しているため、この分野を理解するためにどのようにアプローチしますか?
PS: データ マイニングと分析が別々の場合に混合するなど、クエリに誤りがあった場合は、申し訳ありません。私の核となる質問が明確であることを願っています。