Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私はClouderaデモVMでMahoutを実験しており、k-Meansを使用してサンプルの合成制御データ(https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html)を正常にクラスタリングしました。アルゴリズム。ClusterDumperを使用して、Mahout出力を表示できますが、出力をHiveテーブルに配置したいと思います。どうすればこれを行うことができますか?
直接統合はありません。最善の策は、ClusterDumperを変更して、表形式のデータとしてHiveにインポートできるある種のテキスト表現を生成することです。
Hiveで外部テーブルを作成します。これは、Mahout o/pパスを指している必要があります。