Weka ベースの分類器の入力モデルとして、Mahout デシジョン ツリー トレーニング プロセスの出力モデルを使用したいと考えています。
何百万ものトレーニング レコードに基づく複雑なデシジョン ツリーのトレーニングは、単一ノードの Weka 分類器ではほとんど実用的ではないため、Mahout を使用して、たとえばRandom Forest Partial Implementationを使用してモデルを構築したいと考えています。
上記のアルゴリズムはトレーニング中に問題になる可能性がありますが、単一のマシンで Weka を使用して予測に使用するのはかなり簡単です。
Mahout wiki サイトでは、インポート用のデータ形式には Weka ARFF 形式が含まれますが、エクスポート用ではないと記載されています。
Mahoutの既存の実装の一部を使用して、単純な Wekaベースのシステムで本番環境で使用されるモデルをトレーニングすることは可能ですか?