27

私はデータマイニングのプロジェクトに取りかかる予定です。本題に入る前に、Web ベースのレポート作成を可能にするさまざまなデータ マイニング ツール (できればオープン ソース) を調べてみました。私のシナリオでは、データが提供されるため、クロールする必要はありません。

簡単に言うと、データ分析、Web ベースのレポート、何らかのダッシュボードとマイニング機能を提供するツールを探しています。

私は Microsoft Analysis Services と BOXI に取り組んできましたが、最近は Pentaho を調べていました。これは良い選択肢のようです。

あなたが知っているそのようなツールについてのあなたの経験を共有してください。

乾杯

4

20 に答える 20

12

WEKA は最高のオープン ソース DM ソフトウェアだと思います。

確認してください: http://www.cs.waikato.ac.nz/ml/weka/

于 2009-05-07T16:55:58.233 に答える
9

Weka は優れていますが、代わりに Orange Data Mining ツールキットを試してみることをお勧めします。

http://www.ailab.si/orange/

編集:そして 2010 年 11 月の時点で、私はKNIMEが本当に好きだと言わざるを得ません。

于 2009-09-10T04:15:18.287 に答える
5

RapidMinerは私の好みのデータマイニングツールです。

于 2011-05-31T08:48:19.597 に答える
5

Apache Mahoutもチェックしてください。これは、ユーザー クラスタリングなどの大規模な機械学習タスクに非常に役立ちます。

于 2010-03-09T15:45:00.820 に答える
5

Rには、データ マイニングに関連する多くの優れたパッケージがあります。特に、以下を見てください。

また、Weka にも関連付けられています ( RWeka パッケージを参照してください)。また、.Net (COM 経由) または Python (RPy または RPy2 経由) と統合できます。

レポート プラットフォームとしての Pentaho については同意しますが、使用目的によっては非常に大きなプロジェクトになります。

于 2009-09-18T20:32:38.427 に答える
3

私は新しいグーグルツールで試してみます。

-まず、GoogleストレージのAPI IDを取得する必要があります。これは、分析するデータを保存および操作する場所です。

-次に、google-prediction-api(http://code.google.com/apis/predict/docs/getting-started.html)のAPI IDを取得する必要があります。これは、私が見たところ、素晴らしい外部委託データです。マイニングプロセッサ。Prediction APIを使用すると、データからより多くの情報を取得し、そのパターンにアクセスしやすくなります。従来の数値データと名目データを使用することに加えて、このAPIのおかげで、たとえば言語ごとに電子メールを分類するために利用できるテキストデータを使用することもできます。

-最後に、アドホック分析、標準化されたレポート、データ探索アプリのプロトタイピングを実行できるbigQueryを使用できます(http://code.google.com/apis/bigquery/)

于 2010-11-03T04:11:29.100 に答える
3

KEEL ( http://keel.es ) は Java で書かれており、データ マイニングに進化的計算を使用するのに適しています。

于 2012-02-12T08:31:41.170 に答える
2

私のソフトウェア、SPMF データ マイニング フレームワークを確認できます。

これは、次の目的で 70 を超えるアルゴリズムを提供するオープンソースの Java ソフトウェアです。

  • 頻繁なアイテムセットのマイニング、
  • アソシエーション ルール マイニング、
  • シーケンシャルパターンマイニング
  • シーケンシャル ルール マイニング。
  • もっと..
于 2012-03-05T04:24:53.763 に答える
2

WEKA (既出)、Orange (http://orange.biolab.si/)、Tanagra (http://data-mining-tutorials.blogspot.com) では、優れたチュートリアルを見つけることができます。

データマイニングのための非常に優れたツールです。

于 2012-02-24T08:07:36.203 に答える
2

JMLR が管理している機械学習用のオープン ソース ソフトウェアのリストをご覧ください。ここで見つけることができます:

http://mloss.org/software/

http://jmlr.csail.mit.edu/mloss/

彼らは最先端を代表しています!

Weka に関する私の問題は、その中の多くのアルゴリズムが古くなっていることです。

于 2010-05-07T09:53:47.910 に答える
2

RapidMiner は、このリストに追加すべき優れたツールだと思います。

于 2010-10-06T11:00:25.007 に答える
1

Pentahoは非常にプロフェッショナルなソリューションです。間違いなく非常に良い選択です。

于 2009-09-18T20:40:50.190 に答える
1

Weka は分類と機械学習に強いです。多くの人にとって、これは実際のデータマイニングよりも人工知能の一部であると考えられています. RapidMiner はほぼ同じ方針ですが、UI ははるかに優れています。Pentaho は、Weka AFAICT の専門的なサポートです。

ELKI ( http://elki.dbs.ifi.lmu.de/ ) を参照してください。これは、データ マイニングの他の 2 つの重要なタスクであるクラスタリング アルゴリズムと外れ値の検出に焦点を当てた同等のプロジェクトです。

于 2011-11-25T17:57:19.557 に答える
1

KNIMEもこのリストに加わるに値すると思います。

于 2010-06-07T03:36:51.470 に答える
1

Data Mining SDKとそのブログを見ることができます。

于 2010-01-04T13:29:47.563 に答える
1

Eclipse BIRT http://www.eclipse.org/birt/phoenix/project/description.php

于 2010-03-09T16:00:57.137 に答える
1

いくつかのオープン ソース データ マイニング ツールのリストがここにリストされています: http://dataminingtools.net/browse.php

于 2010-03-02T14:04:44.527 に答える
0

ツールに加えて、Python と R を学習することを強くお勧めします。これらの言語は、分析中に大いに役立ちます。また、大規模なデータセットを「カスタム分析」することもできます。また、Javascript を使用して独自のカスタム ダッシュボードを作成することもできます (多数のチャートおよび視覚化ライブラリを確認してください) 。

于 2010-12-29T13:11:17.163 に答える
0

データマイニングツール weka をご覧ください

WEKA チュートリアルのチュートリアルとビデオのコレクションへのリンクは次のとおりです: http://www.dataminingtools.net/browsetutorials.php?tag=weka 

ビデオ: http://www.dataminingtools.net/videos.php?id=6 

于 2010-03-09T15:41:33.043 に答える
-1

私は自分自身がpython-erであり、言わなければなりません:

はい!これらはすべて Python で実行できます。

最後に Beautiful Soup[0] をいじりました。これは非常に使いやすいモジュールで、html と xml からデータを取得/マイニングできます (「スクリーン スクレイピング」に優れています)。

あなたがPythonを知らないなら、....まあ、学ぶのは本当に簡単です。

[0] http://www.crummy.com/software/BeautifulSoup/

于 2009-05-07T18:36:13.793 に答える