1

RHadoopまたはRHIPEを利用して分散Hadoopクラスターで実行する既存のRクラスタリングパッケージ(kmeans、階層)はありますか?

ありがとう

4

1 に答える 1

1

RevolutionAnalytics / RHadoopプロジェクト パッケージの RHadoop 実装は、rhdfs、rhbase、および rmr を介して Hadoop と R を接続します。

R のみを使用する場合 (スライド 14-15 に示すように rmr パッケージを使用) と比較して、K-means クラスタリング アルゴリズムを "標準的な" 方法 (スライド 8-10 に示すように Python、Pig、および Java を使用) で実装することを知っています。必要なコードがはるかに少なく、単一の言語で実装できます

同じドキュメントには、Python、Java、および R での K-meansの比較実装があり、Rの使用がいかに簡単かを示しています。

このパッケージを Hadoop クラスターで実行すると、Hadoop で K-means クラスタリングを記述できるようになります。

R を選択しない場合は、Hadoop と Mahout で K-means クラスタリング (MapReduce を使用してビルド) を使用できるため、Hadoop クラスターで確実に実行できます。

于 2012-06-01T23:49:06.900 に答える