Java のプロジェクトでMalletライブラリを使用しています。
それぞれ 400 個のトークンを持つ 15,000 個のドキュメントがあります。使ってみParallelTopicModel
ました。しかし、単一のトークンとトークンのシーケンスの両方を含む一連のトピックが必要です (たとえば、「Java」と「Java 開発者」)。
LDA-HMMの使用を検討しています。どのクラスのマレットを使用できますか?
次に、すべてのトピックをベイジアン ネットワークのノードに変換し、トークンまたは一連のトークンを証拠として受け取り、推論を行います。そのためにどのJavaライブラリを使用できますか?
前もって感謝します。フランチェスコ