1

「効率的なニューラル ネットワークの重みと接続の両方を学習する」という論文では、基準に従ってニューラル ネットワークのサイズを縮小します。ただし、この論文のすべての実装がモデルのサイズを物理的に縮小するわけではないことがわかりました。同じ結果を得るために、一部のニューロンの重みをゼロにしているだけです。ただし、物理的にモデルのサイズと推論時間は変わりません。どうすれば物理的にこれを行うことができるのだろうか?

4

0 に答える 0