10

多次元データのクラスタリングをサポートするC/c ++機械学習ライブラリにはどのようなものがありますか?(たとえば、K-Means)

これまでに出くわした

私は自分自身を転がしたくなりますが、既存のものは、コードにもっと目を向けることで、はるかに優れたパフォーマンス最適化であると確信しています。

4

2 に答える 2

10

東京大学のヒトゲノムチームによるオープンソースCクラスタリングライブラリは有望に見えます。K-meansと、その他のフラットな階層的クラスタリングアルゴリズムがあります。GUIのない​​ベアライブラリのページを下にスクロールします。ウィキペディア-クラスタリングプロジェクトは素晴らしく、少し軽いようです。これは、マリランド大学の特殊なK-meansライブラリです。データの種類を考慮して、これらを確認することをお勧めします。特徴ベクトルを作成するためのデータの前処理は難しい場合があります。

于 2009-05-03T07:05:04.817 に答える
2

C4.5、ID3などのアルゴリズムを探しているかどうかはわかりません。そうした場合、それらが活発に研究されている大学のウェブサイトから個々の情報源をダウンロードすることができます。

例:C4.5ソースはQuinlanのWebサイトにあります。

于 2009-05-02T19:22:00.467 に答える