問題タブ [ctc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
50 参照

keras - Keras カスタム損失関数がプログレス バーで更新されない

LERメトリックを計算するための次のコードがあります:

CTC損失関数を使用して、勾配とLERを「精度」メトリックの形式として更新したいと考えています。CTC 損失が機能し、正常に更新されている間、LER (decoded_loss) は常に 0.0000e+00 のままです。何が間違っているのかわかりませんが、これを修正しようとしてオンラインで例を見て丸一日を失いましたが、問題は同じままです。デコード関数内で値を出力すると、値が適切に生成されていることがわかりますが、進行状況バーは更新されません。トレーニングがエポックを通過するにつれて、LER がどのように変化するかを確認したいと思います。

0 投票する
0 に答える
37 参照

pytorch - CTCloss を使用した RCNN モデルが機能しないのはなぜですか?

私の損失関数は、すべての予測を空白文字として予測する傾向があります。今日、単純な OCR タスクの CRNN + CTCLOSS コードを書きましたが、うまくいきませんでした。具体的には、モデルの出力結果は、空白記号に対応する数字です

ここに画像の説明を入力

0 投票する
1 に答える
62 参照

mozilla-deepspeech - (0) 無効な引数: ターゲット遷移シーケンスに十分な時間がありません (必須: 28、使用可能: 24) Mozilla Deepspeech のトレーニング中

以下のコマンドを使用して、ディープスピーチ モデルのトレーニングを開始しています

次のエラーが何度も発生し続けます。

0 投票する
1 に答える
51 参照

python - CTC 損失 keras の実装

これに似た基本モデルがあるという事実を考慮してください。

CTC 損失をどのように実装しますか? 次のような OCR の keras コード チュートリアルから何かを試しました。

ただし、モデルに「ラベル」入力レイヤーを供給する方法がわからないため、model.fit部分に関してはバラバラになり始めました。チュートリアルのアプローチは非常に明確であると思いますが、CTC 損失を実装するためのより適切で効率的な方法は何でしょうか?