多次元データのクラスタリングをサポートするC/c ++機械学習ライブラリにはどのようなものがありますか?(たとえば、K-Means)
これまでに出くわした
- SGI MLC ++ http://www.sgi.com/tech/mlc/
- OpenCV MLL
私は自分自身を転がしたくなりますが、既存のものは、コードにもっと目を向けることで、はるかに優れたパフォーマンス最適化であると確信しています。
多次元データのクラスタリングをサポートするC/c ++機械学習ライブラリにはどのようなものがありますか?(たとえば、K-Means)
これまでに出くわした
私は自分自身を転がしたくなりますが、既存のものは、コードにもっと目を向けることで、はるかに優れたパフォーマンス最適化であると確信しています。
東京大学のヒトゲノムチームによるオープンソースCクラスタリングライブラリは有望に見えます。K-meansと、その他のフラットな階層的クラスタリングアルゴリズムがあります。GUIのないベアライブラリのページを下にスクロールします。ウィキペディア-クラスタリングプロジェクトは素晴らしく、少し軽いようです。これは、マリランド大学の特殊なK-meansライブラリです。データの種類を考慮して、これらを確認することをお勧めします。特徴ベクトルを作成するためのデータの前処理は難しい場合があります。
C4.5、ID3などのアルゴリズムを探しているかどうかはわかりません。そうした場合、それらが活発に研究されている大学のウェブサイトから個々の情報源をダウンロードすることができます。
例:C4.5ソースはQuinlanのWebサイトにあります。