次のコマンドを使用して、いくつかのドキュメントからトピック モデルを生成しました。
bin/mallet train-topics --input topic-input.mallet --num-topics 100 --output-state topic-state.gz
ただし、--output-model
シリアル化されたトピック トレーナー オブジェクトを生成するオプションは使用していません。状態ファイルを使用して、新しいドキュメントのトピックを推測する方法はありますか? トレーニングは遅く、シリアル化されたモデルをゼロから作成する必要がある場合、再トレーニングに数日かかります。