また、カスケードのPacoNathanのエンタープライズデータワークフローを読むことを検討することもできます。RまたはSASからエクスポートされたクラスターでPMMLを実行できます。それは、Mahout in Actionについて悪いことを言っているわけではありません。著者は素晴らしい仕事をし、それを有益で興味深いものにするために明らかに良い時間と労力を費やしました。これは、Mahoutを超えて見るための提案です。現在のところ、よりユーザーフレンドリーな場合のような牽引力は得られていません。
現状では、Mahoutのユーザーエクスペリエンスはやや途切れ途切れであり、インテリジェントシステムとそのライフサイクルであるIMOを開発および更新する方法を明確に理解することはできません。Mahoutは、学者にとっても実際には受け入れられません。MatlabまたはRを使用する可能性が高くなります。Mahoutのドキュメントでは、ランダムフォレストの実装はほとんど機能せず、ドキュメントには誤った例があります。 Mahoutルーチンはアルゴリズムに依存します。私は現在、Mahoutが現状のままどこでも堅実に進んでいるとは思っていません。これもIMOです。私が間違っているといいのですが!
http://shop.oreilly.com/product/0636920028536.do