0

lda-c-dist パッケージの推論結果について質問があります。推論の結果を表示するときに表示される単語数は? たとえば、単語数を非常に大きな数 N (すべての用語の数を N と仮定) に設定すると、いくつかの単語グループが存在するように見えます。各グループでは、単語のインデックスは 1 から N の範囲です。

私が得たのは、用語の数が10であると仮定し、表示される単語の数を10に割り当てるようなものです。

Topic 0xx:
001
008
009
002
003
007
000
004
005
006

どうやら、表示される単語を 10 ではなく 3 に設定する必要があるようです。

では、1 つのトピックについて、topics.py を呼び出してトピックを表示する場合、何語を指定すればよいのでしょうか。

さらに、この出力を使用して、2 つのトピックの類似性を計算します。そう ...

4

1 に答える 1

0

Actually, there can be as many items as the vocabularies are. What is displayed here, is just a probability descending order for a limited number indicated.

于 2013-01-29T11:13:37.367 に答える