0

私は次のレポ https://github.com/kingoflolz/mesh-transformer-jaxに従ってGPTJ-6Bモデルansに取り組んでいます

新しい小さなデータセットに基づいて、転移学習を適用し、最後のいくつかのレイヤーをトレーニングしたいと思います。このリポジトリまたは他の gpt モデルに転移学習を適用した人はいますか?

4

0 に答える 0