2

オプションを使用してマレットを実行したいのですが、--use-ngrams true機能しないようです。以下を使用してデータをインポートしました:

./bin/mallet import-dir --input path --output topic-input.mallet --keep-seqence -- removed stopwords

今、私は局所的なngramモデルを訓練したいと思います:

bin/mallet train-topics --input topic-input.mallet --use-ngrams true --num-topics 30 --xml-topic-report topic-report.xml

しかし、私はこのエラーを受け取ります:

Exception in thread "main" java.lang.ClassCastException: cc.mallet.types.FeatureSequence cannot be cast to cc.mallet.types.FeatureSequenceWithBigrams
at cc.mallet.topics.TopicalNGrams.estimate(TopicalNGrams.java:78)
at cc.mallet.topics.tui.Vectors2Topics.main(Vectors2Topics.java:249)

ご覧のとおり、私はマレットをコマンドラインツールとして実行しており、APIをこじ開けて機能させることはしたくありません。助言がありますか?

4

1 に答える 1

4

答えが見つかりました:

'--keep-sequence-bgirams'引数を使用して、topical-ngramモデリングを実行するディレクトリをインポートする必要があります(例:

./bin/mallet import-dir --input path --output topic-input.mallet --keep-sequence-bigrams --remove-stopwords

次に、トピックモデルを次のように実行します。

bin/mallet train-topics --input topic-input.mallet --use-ngrams true --num-topics 30 --xml-topic-report topic-report.xml
于 2012-03-28T19:48:43.240 に答える