0

このチュートリアルでは、多項分布を熱心な実行で使用して、RNN からの予測テンソルに基づいて、テキスト生成用の次の文字の最終予測を取得します。

# using a multinomial distribution to predict the character returned by the model
temperature = 0.5
predictions = predictions / temperature
predicted_id = tf.multinomial(predictions, num_samples=1)[-1,0].numpy()

私の質問は次のとおりです。

  1. 温度 (ここでは 0.5) はすべての予測をスケーリングするだけではありません。なぜそれが多項選択に影響を与えるのでしょうか?

    [0.2, 0.4, 0.3, 0.1]/温度 = [0.4, 0.8, 0.6, 0.2]

    では、多項式は確率を正規化していませんか? したがって、スケーリングするとき、各キャラクターの確率を1に制限して増やすだけですか?

  2. [-1, 0].numpy() は何をしますか? 私はこれで完全に迷っています。

ヒントをいただければ幸いです。

4

1 に答える 1