問題タブ [handwriting-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
964 参照

python - 単一の例で CTC 損失と変動するラベル エラー率 (編集距離) が収束しない?

このアーキテクチャの手書き認識モデルをオーバーフィットさせようとしています:

tensorflow からのこの mdrnn コード (いくつかの変更を加えたもの):

トレーニング ctc_loss は減少しますが、1000 エポック後でも収束しません。ラベルのエラー率は変動するだけです。

ここに画像の説明を入力

次のように画像を前処理します。

ここに画像の説明を入力

また、ネットワークがいくつかのポイントで同じ予測を生成することにも気付きました。

これが起こっている理由は何ですか?これは、私が作成した小さな再現可能な例ですhttps://github.com/selcouthlyBlue/CNN-LSTM-CTC-HIGH-LOSS

アップデート

これから変換を変更すると:

これに:

パフォーマンスは何とか改善されました:

(ここで mdrnn レイヤーを削除)

ここに画像の説明を入力

(2nd RUN)

ここに画像の説明を入力

(mdrnn レイヤーを追加し直しました)

ここに画像の説明を入力

しかし、損失はまだゼロにはなっておらず (またはゼロに近づいていません)、ラベル エラー率は依然として変動しています。

の減衰率でオプティマイザを からAdamに変更した後、損失は収束しました!RMSProp0.9

RMS プロップの改善 1

実効値プロップの改善 2

ただし、ラベル エラー率は依然として変動します。しかし、損失が収束した今、それは下がるはずです。

その他のアップデート

私が持っている実際のデータセットで試してみたところ、改善されました!

進行前

トレーニングの進捗状況の改善

しかし、何らかの理由でラベルのエラー率が増加していることはまだ不明です。