1

データクラスター分析を行う方法を探しています。これは私のリーグからは程遠いですが、私はそれができることを知っています. 私が持っているデータをクラスター化し、視覚的に提示する方法を探しています。頭に浮かぶのは樹形図ですが、他の提案も受け付けています。

この作業に役立つ、既に作成されているスクリプトまたはクラスはありますか? 私はLAMP内にとどまることを好みます。

ありがとう。

4

1 に答える 1

1

私が知っている最も完全なオープンソースツールは、ドキュメントクラスタリング用のcarrot2オープンソースフレームワークです。これらは主にJavaと.NET中心ですが、RESTインターフェースを介してRubyとPHP5で使用できます。使用するフレームワークに比較的簡単に統合できる必要があります。

これは彼らのホームページです-http://project.carrot2.org/index.html

これは彼らのクラスターエンジンと視覚化のオンラインデモです。円の視覚化はあなたの興味を引くかもしれません(クエリを入力すると、3つの視覚出力タブがあります。それは真ん中のタブです)-http://search.carrot2.org/stable/search

これは彼らの商用製品、lingo3gです-http ://search.carrotsearch.com/carrot2-webapp/search。ほとんどのクエリのクラスタリングで6〜8倍高速で、結果のさまざまな(より良い?)クラスタリングを提供し、階層的クラスタリングと対応する視覚化を提供します。試用をリクエストして電子メールで送信できることを使用したい場合は、2か月の試用ライセンスで対応するすべての資料(carrot2オープンソースのダウンロードとして)にアクセスできます。

これがあなたが探しているものではなく、ライブラリの生のコレクションだけが必要な場合は、apacheのmahoutプロジェクトをチェックすることもできます。

于 2011-06-30T17:23:43.143 に答える