このチュートリアルでは、多項分布を熱心な実行で使用して、RNN からの予測テンソルに基づいて、テキスト生成用の次の文字の最終予測を取得します。
# using a multinomial distribution to predict the character returned by the model
temperature = 0.5
predictions = predictions / temperature
predicted_id = tf.multinomial(predictions, num_samples=1)[-1,0].numpy()
私の質問は次のとおりです。
温度 (ここでは 0.5) はすべての予測をスケーリングするだけではありません。なぜそれが多項選択に影響を与えるのでしょうか?
[0.2, 0.4, 0.3, 0.1]/温度 = [0.4, 0.8, 0.6, 0.2]
では、多項式は確率を正規化していませんか? したがって、スケーリングするとき、各キャラクターの確率を1に制限して増やすだけですか?
[-1, 0].numpy() は何をしますか? 私はこれで完全に迷っています。
ヒントをいただければ幸いです。