私は次のレポ https://github.com/kingoflolz/mesh-transformer-jaxに従ってGPTJ-6Bモデルansに取り組んでいます
新しい小さなデータセットに基づいて、転移学習を適用し、最後のいくつかのレイヤーをトレーニングしたいと思います。このリポジトリまたは他の gpt モデルに転移学習を適用した人はいますか?
私は次のレポ https://github.com/kingoflolz/mesh-transformer-jaxに従ってGPTJ-6Bモデルansに取り組んでいます
新しい小さなデータセットに基づいて、転移学習を適用し、最後のいくつかのレイヤーをトレーニングしたいと思います。このリポジトリまたは他の gpt モデルに転移学習を適用した人はいますか?