7

Python で Tensorflow を使用して画像を分類するための CNN + Ensemble モデルを構築しています。google images で犬と猫の画像をクロールしました。次に、それらを 126 * 126 ピクセル サイズとグレー スケールに変更し、ラベル 0 を犬に、1 を猫に追加します。CNN には 5 つの conv 層と 2 つの fc 層があります。HE、PReLU、max-pooling、dropout、Adam をモデルに使用。Parameter Tuning が終わったら、Early-Stopping を追加しました。モデルは 65~70 エポックを学習し、92.5~92.7% の精度で終了しました。学習が終わった後、CNN モデルを VGG ネットワークに変更したいので、CNN パラメータを確認したところ、驚いたことに、conv 層に Bias を追加していないことがわかりました。2 fc レイヤーにはバイアスがありましたが、5 conv レイヤーにはバイアスがありませんでした。そのため、5 つの conv レイヤーに Bias を追加しましたが、モデルが学習できませんでした。コストが無限に増加しました。

バイアスは必ずしも深い畳み込み層にあるとは限りませんか?

4

1 に答える 1