データ ウェアハウジングとデータ アナリストの仕事に就きたいと考えています。データマイニングとウェアハウジングに関する本を読んでいます。しかし、確率、フーリエ変換、ウェーブレット関数などの専門的な数学に夢中になっています。
私はこれらの統計数学の詳細があまり得意ではありません。
私がDWの仕事業界で働いているなら、物事はすでにそれらの上に構築されており、その数学は必要ないことを学ぶ必要があるかどうかを知りたい.
データ ウェアハウジングとデータ アナリストの仕事に就きたいと考えています。データマイニングとウェアハウジングに関する本を読んでいます。しかし、確率、フーリエ変換、ウェーブレット関数などの専門的な数学に夢中になっています。
私はこれらの統計数学の詳細があまり得意ではありません。
私がDWの仕事業界で働いているなら、物事はすでにそれらの上に構築されており、その数学は必要ないことを学ぶ必要があるかどうかを知りたい.
データマイニングは大きな分野です。さまざまなデータ マイニング手法と問題が数多くあります。
統計学や数学のバックグラウンドを持ち、数学を多用する人もいます。
しかし、アルゴリズム、コンピューター サイエンス、またはデータベースのバックグラウンドを持つ人もいます。それらのいくつかは、数学をあまり使用しません。
したがって、データマイニングで何をしたいかによって異なります。
また、いくつかのアルゴリズムを適用するだけの場合は、他の人によって既にプログラムされているデータ マイニング ツールを使用できるため、自分で設計する必要はありません。
しかし、一般的に、数学はコンピュータ サイエンスと非常に強く関連しています。
データ マイニングは、統計学者が数学を考えるのに忙しすぎたため、コンピューター科学者によって発明されました。彼らは間違いなくその上にボールを落としました。
統計側の本は数学に焦点を当てており、コンピュータ サイエンス側の本はプロセスに焦点を当てています。
私はプログラミング集団知能 (O'Reilly) から始めますが、これには数学があまりありません。
また、Excel を使用して多くのデータ マイニングを実行できることを示している Kardi Teknomo の研究もチェックします。
データマイニングは統計に重点を置いています。それを本当に機能させるには、自分が何をしているのかをよく理解する必要があります。最初は見栄えがよくても、実際にはまったく機能しない結果が得られるのは簡単です。これは、たとえば過適合であったり、統計的に有効でなかったりするためです。
データ ウェアハウジング側からアプローチしないでください。彼らは、データマイニングが何であるかを知りません。DW の人々にとっては、予測平均を計算することさえ「データ マイニング」であることがよくあります。