mahout で分類器を構築しようとしています。モデルが構築された後。ターゲット ドキュメントをモデルに「フィード」して、分類結果を取得する必要があります。
mahout のソース コードでテストケースを確認したところ、一定量のフィールドを持つ DenseVector が使用されています。ただし、テキスト ドキュメントを分類するために mahout を使用しています。入力は文字列 (または文字列を含む配列) です。有効な「ベクター」インスタンスに変換する方法。
StaticWordEncoder と RandomAccessSparseVector を試しましたが、結果が正しくありません。理由がわかりません。ちょっと絶望的。