最後に、mahout分類子をトレーニングできます。今、私の問題は、入力ドキュメントのターゲットカテゴリを取得する方法です。
テキストドキュメントのターゲットカテゴリを取得するプロセスは何ですか?
最後に、mahout分類子をトレーニングできます。今、私の問題は、入力ドキュメントのターゲットカテゴリを取得する方法です。
テキストドキュメントのターゲットカテゴリを取得するプロセスは何ですか?
まず、テキスト ドキュメント RandomAccessSparseVector をベクトル化する必要があります。
参照用のサンプル コード:
Vector vector = new RandomAccessSparseVector(FEATURES);
FeatureExtractor fe = new FeatureExtractor();
HashSet<String> fs = fe.extract(text);
for (String s : fs) {
int index = dictionary.get(s);
vector.setQuick(index, frequency.get(index));
}
次に、Classifier.classify(Vector) を使用して結果を取得します。