13

RにこのLDAパッケージを使用しています。具体的には、教師付き潜在ディリクレ割り当て(slda)を実行しようとしています。リンクされたパッケージには、slda.em関数があります。しかし、私を混乱させるのは、アルファ、イータ、および分散パラメーターを要求することです。私が理解している限り、これらのパラメーターはモデルでは未知数であると考えていました。私の質問は、パッケージの作成者は、これらがパラメーターの初期推測であると言うつもりでしたか? はいの場合、実行結果からそれらにアクセスする方法はないようですslda.em

アルゴリズムで追加の EM ステップをコーディングする以外に、これらのパラメーターの妥当な値を推測する方法はありますか?

4

1 に答える 1

4

教師ありモデルを生成しようとしているため、典型的なアプローチは、交差検証を使用してモデル パラメーターを決定することです。したがって、データの一部をテスト セットとして保持し、残りのデータでモデルをトレーニングし、k 回繰り返してモデルのパフォーマンスを評価します。次に、さまざまなモデル パラメーターを使用して繰り返し、どのモデル パフォーマンスが最適かを判断します。

slda の特定のケースでは、作成者による sldademo(slda)の実装を確認するために実行します。alpha=1.0デモを実行すると、彼が、eta=0.1、およびを設定していることがわかりますvariance=0.25。これらを出発点として使用し、モデルのパフォーマンスを改善する必要がある場合は、相互検証を使用してより良いパラメーターを決定することをお勧めします。

于 2016-05-03T19:26:24.593 に答える