基盤となるフレームワークが Java コードを取り、それを Hadoop で実行するように、JAVA で機械学習アルゴリズムを実装するための Mahout 以外に存在するフレームワークはどれですか?
SVM と Hadoop での凝集クラスタリングの実装が必要であり、Mahout では SVM のみがサポートされているため、Mahout の代替手段を探しています。
基盤となるフレームワークが Java コードを取り、それを Hadoop で実行するように、JAVA で機械学習アルゴリズムを実装するための Mahout 以外に存在するフレームワークはどれですか?
SVM と Hadoop での凝集クラスタリングの実装が必要であり、Mahout では SVM のみがサポートされているため、Mahout の代替手段を探しています。
Apache Mahout のような Apache Hadoop ベースの機械学習/データ マイニング ライブラリをお勧めします。
http://www.openankus.org/pages/viewpage.action?pageId=2195722
とてもシンプルで簡単な mapreduce ジョブの処理です。興味がありますか?もっとウィキを見る ( http://www.openankus.org )
SVM が Hadoop 上にあれば、あとは簡単に実装できます。
単純な凝集クラスタリング アルゴリズムは、大きなデータ (O(n^2) の複雑さ) に対しては効率的ではないことに注意してください。このような複雑さにより、大規模なクラスターであっても、大規模なデータセットでアルゴリズムを実行することは不可能になります。次のような拡張機能のいずれかを試してください。ftp://193.167.42.127/franti/papers/GraphPnn-TPAMI.pdf
パターン。Java API があり、R も使用できます。
簡単なグーグルで次のことがわかりました
http://java-ml.sourceforge.net/ - 3 年近く経ってリリースされました。それがどの程度サポートされているか、どのアルゴリズムが実装されているかはわかりません。
http://sourceforge.net/projects/weka/ - 他の人による最近の推奨事項のいくつかは良さそうです。
また、このスレッドを参照してください。
どちらも試していません。