0

機械学習を始める最も簡単な方法は何でしょうか?

非常に実用的なアプリケーションがあります。

何人かのマネージャーが私の膝に「もの」のデータウェアハウスを投げて、何が売り上げを押し上げているのかを教えてくれと頼みました。

データには次のものが含まれます。

sales by client (clients being doctors offices)
sales by doctor
products they bought
client demographics
all kinds of different date information

データを要約すると、これは基本的に、会社がすべてのクライアントと行ったすべてのトランザクションの完全なデータと、すべてのトランザクションの詳細情報です。

データはすべてSQLServer2008に保存されます。

質問:傾向/パターン/関係の分析を開始するデータベースに接続できるc#/ pythonにすでに存在するツールはありますか?

具体的 には、PythonまたはC#を使用した機械学習アルゴリズムをデータに適用して、ある種の意味のある情報を抽出するにはどうすればよいですか?

4

3 に答える 3

1

SQL Server 2008にバンドルされているデータマイニングツールを入手できます。実際の例については、「SQLServer2008でのデータマイニングの概要」などをグーグルで検索することから始める必要があります。

于 2012-11-27T02:05:26.800 に答える
1

この質問へのアプローチをどこから始めればよいかわかりません。まず、ここでの問題は「機械学習」ではありません。大量のデータベース テーブルを取り込んで、「何が売り上げを促進しているか」などの質問に答えられるソフトウェアはありません。まあ、人々はこれをうまくやっていないので、監視されていないコンピューターに多くのことを求めています。

データに質問への回答が含まれているかどうかはわかりません。データには、販売されたものやその他のさまざまな要因の説明が含まれています。これらの「ドライブ」販売がかなり主観的であるかどうか。

他の人は、プログラミング ツールについて貴重な提案をしてくれました。プログラミング ツールではなく、データ マイニング ツールに注目することを強くお勧めします。SQL Server にはツールが組み込まれています。それが役立つかどうかはわかりません。ツールのリストはこちらでご覧いただけます。これらのいくつかはフリーウェアです。プログラミングを通じてそれらにアクセスする場合、2 つの問題に直面します。1 つ目は、結果ではなく、問題の「プログラミング」側のみに集中することです。2つ目は、良い結果が得られたとしても、それを他人に伝える立場にないことです。

最後に、彼らが本当に求めているのは、さまざまな次元に沿ってデータを細かく分割できるツールであり、これは SQL Server でも利用できると思います。ファクト テーブル構造に従って一連のテーブルをまとめることができます (Ralph Kimball が「The Data Warehouse Toolkit」などの著書で説明しているように)。これは、機械学習の問題ではなく、レポートの問題のように思えます。

于 2012-11-27T05:14:59.427 に答える
1

Google には予測 / 機械学習 API があります。これは、理解よりも結果に関心がある場合に非常に便利です (ただし、何をしようとしているのかなどを知ることができるように、ある程度のバックグラウンドを持っていることは確かに役立ちます)。理にかなっています)。

https://developers.google.com/prediction/

于 2012-11-27T05:25:24.573 に答える