Map-reduce/hadoop は、さまざまなリソースの山積みのデータから洞察を収集し、それらを私たちが望む方法で整理するのに最適です。
しかし、トレーニングに関して言えば、すべてのトレーニング データをアルゴリズム (SVN、ロジスティック回帰、ランダム フォレストなど) に一度にダンプして、アルゴリズムが次のようなモデルを作成できるようにする必要があるというのが私の印象です。それをすべて。map-reduce/hadoop はトレーニングの部分で役立ちますか? はいの場合、一般的にはどうですか?