0

私は Hadoop を始めたばかりです。非常に大きなデータセットの関連付けルールを計算するために使用する必要があります。R Hadoop と MapReduce を使用してデータセットの関連付けルールを見つける方法がわかりません。私はトランザクションマトリックスを持っていますが、hadoop を使用してこのマトリックスでアプリオリアルゴリズムを実行するにはどうすればよいですか?? これは apriori (パッケージ arules) を実行するために使用されるコマンドです。

rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))

reduce 関数の map 関数で使用する必要がありますか?

4

1 に答える 1

0

私は同じ問題を抱えています (R はルール用の大規模なデータ セットでクラッシュします)。Hadoop上の機械学習エンジンであるMahoutを使用でき、アソシエーション ルールやその他の機械学習アルゴリズム (クラスタリングなど) を備えています。

于 2015-02-25T01:19:50.223 に答える