2

私は R がまったく初めてで、現在tmおよびldaパッケージを使用してログを分析しています。

lda.collapsed.gibbs.samplerは「初期」パラメーターを取ることができ、ドキュメントには次のように記載されています

イニシャル

単語の最初のトピック割り当てのリスト。戻り値の割り当てフィールドと同じ形式にする必要があります。このフィールドが NULL の場合、サンプラーはランダムな割り当てで初期化されます。

しかし、以前の result$assignments を初期パラメーターとして繰り返し渡そうとすると、エラーが発生します。

> result <- lda.collapsed.gibbs.sampler(data, K,vocab,i, 0.1,0.1, initial = lda_result$assignments, compute.log.likelihood=TRUE) 
Error in structure(.Call("collapsedGibbsSampler", documents, as.integer(K),  : 
STRING_ELT() can only be applied to a 'character vector', not a 'NULL' 

それを取り除き、実際にリストを使用する方法がわかりません。私が望むのは、手順を実行してその結果を確認することで収束の尺度を得ることです。そのため、単純にiをより大きな数として置くことはできません。

前もって感謝します!:)

4

1 に答える 1

2

ドキュメントはここで少しむらがあります。を設定する必要がありますinitial=list(assignments = lda_result$assignments)。より一般的には、セットまたはセットとセットの両方initialを持たなければならないリストです。assignmentstopicstopic_sums

于 2014-01-16T19:03:34.120 に答える