Mahout LDA CVB プログラム/オフライン バッチ実行からのトピック モデルが与えられた場合、モデル/オンライン Web サービス呼び出しを使用して新しいドキュメントを推測するのが好きです。
これらのドキュメントは、新規作成や推論にはあまり役に立ちません。* https://builds.apache.org/job/Mahout-Quality/javadoc/org/apache/mahout/clustering/lda/cvb/TopicModel.html * http://svn.apache.org/viewvc/mahout/trunk /core/src/main/java/org/apache/mahout/clustering/lda/cvb/TopicModel.java?view=マークアップ
インターネットやどこかでサンプル コードを見つけることさえできませんでした。
ここで、Javaコードでやりたいと思ったのですが、
TopicModel model = new TopicModel();
Vector documentInTermFrequency = new RandomAccessSparseVector();
documentInTermFrequence.setQuick(termIdX, 10);
documentInTermFrequence.setQuick(termIdY, 20);
Vector docTopic = new DenseVector(new Double[10] { 0.1, 0.1, ..., 0.1 }); // 0.1 probabilities
Vector documentTopicInference = model.infer(documentInTermFrequence, docTopic);
このようなことを試みた人を見たことがありませんか?誰もこのようなことを試したことがありますか?
どんな提案や指針も高く評価されます。