問題タブ [beam-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
268 参照

tensorflow - tf.nn.ctc_beam_search_decoder と tf.contrib.seq2seq.BeamSearchDecoder メカニズムの違いは何ですか?

tensorflow で seq2seq モデルを構築しています。2ビームサーチ機能の詳細を教えてください。ありがとうございました。

tf.nn.ctc.beam_search_decoder https://www.tensorflow.org/api_docs/python/tf/nn/ctc_beam_search_decoder

tf.contrib.seq2seq.BeamSearchDecoder https://www.tensorflow.org/api_docs/python/tf/contrib/seq2seq/BeamSearchDecoder

0 投票する
1 に答える
243 参照

deep-learning - CTC を使用した音声認識で一般的に使用されるプレフィックス ビーム検索を、これほど簡単な方法で実装できますか?

私は最近音声認識について学んでおり、接頭辞ビーム検索[1,1,_]の考え方は、 andなどの同じ接頭辞を持つパスをマージすることであることを学びました[_,1,_](ご覧のとおり、_空白マークを示します)。

この理解に基づいて、次のような擬似コードを使用して簡略化できる私のバージョンを実装しました。

しかし、私がオンラインで見つけたほとんどのバージョン (紙によると) は次のようなものです。

2 つの結果は異なり、私のバージョンはより長い文字列を返す傾向があります。そして、私は主な2つの側面をよく理解していません:

  1. 私のバージョンの詳細で、考慮されていないものはありますか?
  2. new_prefix = prefix + (i,)共通バージョンは、前の末尾が指定された「s」と同じであるかどうかに関係なく、新しいプレフィックスを生成します。たとえば、古いプレフィックスは[a,a,b]and で、新しい文字 s が追加されると、両方とも[a,a,b]保存[a,a,b,b]されます。これだとしたら何の目的でしょうか?そして、それは二重カウントを引き起こしますか?

回答をお待ちしております。よろしくお願いします。