1

最近、データマイニングと機械学習の分野に興味を持っています。膨大なデータセットを調べて、隠れたパターンと傾向を関連付けようとするアイデアは魅力的です。これまでのところ、次のことを行っています

  • Weka を使用して単純なデータセットを読み込み、決定木を生成しました
  • 本、ウィキ、ブログ、SO を同じ場所で継続的に読む
  • SQL Server DM と Python API をいじり始めました
  • ウェブ上で自由に利用できるデータセット (freedb、UN など) のオプションについてアイデアを持っている

私を妨げているのは、分類/関連付けを超えて先験的/アプリオリなアルゴリズムに入ろうとする分です。数学の方程式と論理を理解することは(控えめに言っても)私の強みの1つではないため、立ち往生しています。

ですから、私の質問は、データ マイニングの分野で (プロダクト オーナーまたはビルダーの役割で) 生まれつき数学者ではない人がいますか? もしそうなら、Weka や Rapid-miner のような無料のツールはどちらも数学/統計のバックグラウンドを期待しているため、この分野を理解するためにどのようにアプローチしますか?

PS: データ マイニングと分析が別々の場合に混合するなど、クエリに誤りがあった場合は、申し訳ありません。私の核となる質問が明確であることを願っています。

4

2 に答える 2

2

データ マイニング モデルが示す内容を分析できることは、非常に重要です。ただし、最近では、すべての数学と統計はデータ マイニング モデルによって処理されます。それらの背後にある数学を理解する必要はありません (役に立ちますが)。

たとえば、SQL Server Analysis Services のデータ マイニング アルゴリズムに目を通してみると、テクニカル リファレンスでさえ、これらの実装を再作成する方法ではなく、これらの実装を使用する方法であることがわかります。

ビジネス ケースを理解し、データ マイニングが何を伝えているかを理解できれば、その背後にある数学を掘り下げる必要はまったくありません。

一部の無料ツールについては、使用したことがないため、話すことができません。しかし、私は SSAS とそのデータ マイニング モデルの大ファンです。

于 2009-08-26T12:13:01.813 に答える