1

mahout のドーナツ分類の例に従って、次のようにモデルを構築しました。

ビルドモデル:

./mahout trainlogistic --input donut.csv --output ./model --target color --categories 2 --predictors x y a b c --types numeric --features 20 --passes 100 --rate 10

このモデルを次のように評価します。

./mahout runlogistic --input donut.csv --model model  --auc --confusion

出力は次のとおりです。

AUC = 0.97
confusion: [[27.0, 13.0], [0.0, 0.0]]
entropy: [[-0.4, -0.3], [-1.2, -0.7]]

最初のコマンドは、ローカル ディスクにモデル ファイルを作成しました。このモデルを使用して新しいデータを分類するにはどうすればよいですか? そのためのコマンドはありますか?または、そのモデルをロードして分類する Java コードを作成する必要がありますか?

4

1 に答える 1

2
./mahout runlogistic --input new_data.csv --model model  --auc --confusion

たとえば、donut.csv から 10 個の recode をフェッチし、donut2.csv という名前に変更します。次に、次のようにテストします。

[double@double mahout-distribution-0.7]$ bin/mahout runlogistic --input donut2.csv  --model donut.model --auc --scores --confusion

出力は次のとおりです。

"target","model-output","log-likelihood"
0,0.496,-0.685284
0,0.490,-0.674055
0,0.491,-0.675162
1,0.495,-0.703361
1,0.493,-0.706289
0,0.495,-0.683275
0,0.496,-0.685282
0,0.492,-0.677191
1,0.494,-0.704222
1,0.492,-0.708679
AUC = 0.50
confusion: [[6.0, 4.0], [0.0, 0.0]]
entropy: [[-0.7, -0.4], [-0.7, -0.4]]
13/06/04 15:22:50 INFO driver.MahoutDriver: Program took 1402 ms (Minutes: 0.023366666666666668)
于 2013-06-04T07:29:25.903 に答える