hadoop - Mahout: ランダムフォレストを使用してオンライン予測を行う方法

Question

この簡単な例を試した後、UCI のガラスデータで BreimanExample を試してみました。

私の質問は、Mahout で RandomForest を作成したら、それを使用して予測を行うためにどのように「ロード」するかということです。

Python の sklearn を使用すると、これは簡単です。フォレストをディスクにピクルして、後でロードし、ライブインタラクションのために Web サーバーの背後に配置するだけです。

しかし、Mahout と Hadoop の場合はどうでしょうか。RandomForest を大規模に構築する場合、出力をキャプチャして使用して将来の予測を行うにはどうすればよいですか?

score 1 · Accepted Answer

この例に従ってみてください: https://cwiki.apache.org/MAHOUT/partial-implementation.html BuildForest はモデルを構築するためのもので、TestForest コードはモデルをロードして予測を行う方法を示します。

hadoop - Mahout: ランダム フォレストを使用してオンライン予測を行う方法