Latent Drichlet Allocation (LDA) を使用する Java アプリケーション (大学向け) を作成したいと考えています。LDA を提供する唯一のフレームワークは Mahout でした。私は自分自身を Java プロとは考えていませんが (私は PHP 出身です)、Java プログラミングの経験はかなりあります。アプリケーションは分散コンピューティングのコンテキストでは使用されないため、mahout / hadoop の方法は過剰な方法である可能性がありますが、私が正しければ、少なくとも機能するはずです。
私の問題: Mahout wiki などはあまり役に立ちません。実際、単語が 1 つもわかりません。その「端末の方法」で mahout を使用したくありません。クラスをアプリケーションにロードして、そのようなことをしたいだけです:
ドキュメント = obj.load(ドキュメント); mahout.doLDA(ドキュメント);
(それほど簡単ではないことはわかっていますが、私の言いたいことがわかると思います)。
ありがとう