2

This siteから自然言語処理を学んでいました。

補間動画にハマってしまいました。

P'(W n | W n-1 , W n-2 ) = λ 1 * P(W n | W n-1 , W n-2 ) + λ 2 * P(W n | W n-1 ) + λ 3 * P(W n )

次に、ラムダを設定するには、「保持された」データ セットを取得し、そのデータ セットの確率を最大化するラムダを見つけます。

それは、考えられるすべての数 (無限) をループして、そのうちのどれが確率を最大化するかを見つけるということですか?

まあ無理でしょ?次に、ラムダをどのように選択しますか。確率を増加させるラムダを見つけるのは簡単で、確率を見つけるのも簡単ですが、ラムダを選択するのは大変なことです。

ラムダの選択を手伝ってください!

前もって感謝します!!

4

2 に答える 2

2

これはせいぜい中途半端な推測ですが、彼が行っていることは、その関数の以前の推定値と P の推定値を使用して、P(Wn | Wn-1 , Wn-2) の関数を繰り返し改善しているように見えます。 (Wn | Wn-1) および P(Wn)。彼は、新しい関数が古い関数の加重和であり、それらの λ 値が重みであると仮定しています。これらの重みの合計は 1 になる必要があります。

あなたの仕事は、最適な重みのセットを見つけることです。

そのような問題は、λ 値をループすることによってではなく (正しく直感的にわかるように)、数学を使用して解決します。これらの関数の構造について詳しく知らなければ、それ以上の有用性を語ることは困難です。

運が良ければ、これを行うための比較的単純な微積分式を見つけることができます。運が悪いと、(おそらく) ラグランジュ乗数法を含む比較的複雑な手順になります。明らかな閉じた形式の表現でさえない場合があり、さまざまな山登り、期待値の最大化、またはその他の手法につながります。本当に言えませんでした。

于 2013-07-10T15:11:23.370 に答える
1

単語の重要度の順に重みを設定しますが、確率は 1 を超えることはできないため、重みの合計が 1 になるようにしてください。

于 2013-07-18T11:32:48.983 に答える