データクラスター分析を行う方法を探しています。これは私のリーグからは程遠いですが、私はそれができることを知っています. 私が持っているデータをクラスター化し、視覚的に提示する方法を探しています。頭に浮かぶのは樹形図ですが、他の提案も受け付けています。
この作業に役立つ、既に作成されているスクリプトまたはクラスはありますか? 私はLAMP内にとどまることを好みます。
ありがとう。
データクラスター分析を行う方法を探しています。これは私のリーグからは程遠いですが、私はそれができることを知っています. 私が持っているデータをクラスター化し、視覚的に提示する方法を探しています。頭に浮かぶのは樹形図ですが、他の提案も受け付けています。
この作業に役立つ、既に作成されているスクリプトまたはクラスはありますか? 私はLAMP内にとどまることを好みます。
ありがとう。
私が知っている最も完全なオープンソースツールは、ドキュメントクラスタリング用のcarrot2オープンソースフレームワークです。これらは主にJavaと.NET中心ですが、RESTインターフェースを介してRubyとPHP5で使用できます。使用するフレームワークに比較的簡単に統合できる必要があります。
これは彼らのホームページです-http://project.carrot2.org/index.html
これは彼らのクラスターエンジンと視覚化のオンラインデモです。円の視覚化はあなたの興味を引くかもしれません(クエリを入力すると、3つの視覚出力タブがあります。それは真ん中のタブです)-http://search.carrot2.org/stable/search
これは彼らの商用製品、lingo3gです-http ://search.carrotsearch.com/carrot2-webapp/search。ほとんどのクエリのクラスタリングで6〜8倍高速で、結果のさまざまな(より良い?)クラスタリングを提供し、階層的クラスタリングと対応する視覚化を提供します。試用をリクエストして電子メールで送信できることを使用したい場合は、2か月の試用ライセンスで対応するすべての資料(carrot2オープンソースのダウンロードとして)にアクセスできます。
これがあなたが探しているものではなく、ライブラリの生のコレクションだけが必要な場合は、apacheのmahoutプロジェクトをチェックすることもできます。