1

mahout で分類器を構築しようとしています。モデルが構築された後。ターゲット ドキュメントをモデルに「フィード」して、分類結果を取得する必要があります。

mahout のソース コードでテストケースを確認したところ、一定量のフィールドを持つ DenseVector が使用されています。ただし、テキスト ドキュメントを分類するために mahout を使用しています。入力は文字列 (または文字列を含む配列) です。有効な「ベクター」インスタンスに変換する方法。

StaticWordEncoder と RandomAccessSparseVector を試しましたが、結果が正しくありません。理由がわかりません。ちょっと絶望的。

4

1 に答える 1

0

ドキュメントを単語に解析し、それらからベクトルを設定する必要があります。

これを試みる前に、Mahout In Actionのようなものを読んで背景を理解することをお勧めします。

于 2012-09-04T09:35:45.327 に答える