データマイニング パッケージを評価しています。
これまでのところ、次の2つを見つけました。
ありがとう
別の選択肢はOrangeです。これには、Python スクリプトまたは GUI を介して直接アクセスできるさまざまなアルゴリズムとデータ マイニング手法が含まれています。
車輪を再発明し、R で直接コードを作成します。
頻繁なパターンマイニング、相関ルール、シーケンシャルパターンマイニングに関連するJavaコードに興味がある場合は、これらのトピックに関連する42のアルゴリズムを持つ小さなオープンソースプロジェクトがあります:http://www.philippe-fournier-viger。 com / spmf /
ただし、ユーザーインターフェイスは提供されないことに注意してください。ただし、他のデータマイニングパッケージにはない非常に特殊なアルゴリズムを提供します。
Pentahoは、ビジネス インテリジェンスに最適です。ですので、ちょっと覗いてみてはいかがでしょうか。主にデータ ウェアハウジングの経験があり、非常に満足しています。
( KNIME ) は、かなり広範なデータ マイニング プラットフォームです。
KDnuggets Poll 2011 によると、RapidMiner は再び世界中で最も広く使用されているデータ マイニング ソリューションです 。
ELKIを見てください。WEKAはクラスタリングと外れ値の検出がはるかに強力であることを除いて WEKA に似ていますが、WEKA は基本的に分類のみを行います。
私は高校のコースでWekaを使用しましたが、優れたSVM実装がありました。これは4、5年前のことです。
前述のように、Pentaho は WEKA が属する強力なビジネス インテリジェンス スイートです。
したがって、アプリケーションを拡張するための優れたソリューションと優れたコミュニティがあるという理由だけで、Weka もお勧めします。