問題タブ [beam-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - tf.nn.ctc_beam_search_decoder と tf.contrib.seq2seq.BeamSearchDecoder メカニズムの違いは何ですか?
tensorflow で seq2seq モデルを構築しています。2ビームサーチ機能の詳細を教えてください。ありがとうございました。
tf.nn.ctc.beam_search_decoder https://www.tensorflow.org/api_docs/python/tf/nn/ctc_beam_search_decoder
tf.contrib.seq2seq.BeamSearchDecoder https://www.tensorflow.org/api_docs/python/tf/contrib/seq2seq/BeamSearchDecoder
deep-learning - CTC を使用した音声認識で一般的に使用されるプレフィックス ビーム検索を、これほど簡単な方法で実装できますか?
私は最近音声認識について学んでおり、接頭辞ビーム検索[1,1,_]
の考え方は、 andなどの同じ接頭辞を持つパスをマージすることであることを学びました[_,1,_]
(ご覧のとおり、_
空白マークを示します)。
この理解に基づいて、次のような擬似コードを使用して簡略化できる私のバージョンを実装しました。
しかし、私がオンラインで見つけたほとんどのバージョン (紙によると) は次のようなものです。
2 つの結果は異なり、私のバージョンはより長い文字列を返す傾向があります。そして、私は主な2つの側面をよく理解していません:
- 私のバージョンの詳細で、考慮されていないものはありますか?
new_prefix = prefix + (i,)
共通バージョンは、前の末尾が指定された「s」と同じであるかどうかに関係なく、新しいプレフィックスを生成します。たとえば、古いプレフィックスは[a,a,b]
and で、新しい文字 s が追加されると、両方とも[a,a,b]
保存[a,a,b,b]
されます。これだとしたら何の目的でしょうか?そして、それは二重カウントを引き起こしますか?
回答をお待ちしております。よろしくお願いします。