Hadoop 1.0.4 で Mahout 0.7 を実行しています。トピック モデリング タスクの Reuters データセットの結果を確認したいと考えています。ただし、Mahout で vectordump ツールを使用すると、ちょっと役に立たない結果が得られます。この例の次の一連の手順を読みました:
Run cvb in mahout 0.8。
しかし、vectordump ツールを実行した後、出力に次のような行を含む巨大なファイルが表示されます: {0.01:5.726429339702471E-12,0.05:6.196569958376538E-9,...}ロイター データセットの実際の出力です。
2 に答える
0
同じことが起こっており、解決策は簡単です。svn サーバーで最新バージョンを入手してください: http://svn.apache.org/repos/asf/mahout/trunk
これは、Mahout 0.7 に vectorSize のバグがあるために発生します。
于 2013-05-29T08:14:31.237 に答える