1

文の境界を越えない反復言語モデル (LSTM など) を構築する最善の方法は何ですか? または、より一般的に言えば、バッチをモデルに提示し、各行に複数の文が含まれている場合、各文を確認した後で状態をリセットするにはどうすればよいでしょうか? モデルに指定できる特別なトークンはありますか?

ありがとう!

4

1 に答える 1

0

文が独立している場合は、バッチ内の各行に 1 つの文だけを含めた方がすっきりします。次に、この質問への回答で説明されているように、各バッチの後に LSTM の状態をリセットできます。

于 2016-12-20T09:56:13.280 に答える