0

Ubuntu 12.04Python 2.7&を使用していPocketSphinxます。

オンラインを使っdictionaryてカスタムしました。を使用して話し声をデコードすると、100% の精度が得られます。しかし、サウンドを録音するために使用すると、テキストは認識されますが、下の画像に示すように、メイン コンテキストに「A」と「AND」が追加され ます。language modelLM toolpocketsphinx_continousPyAudioPythonPocketSphinx_Continuous Python での PocketSphinx

4

1 に答える 1

2

精度が低下した理由は、発話の周囲に人為的なゼロ サイレンス領域を追加したことと、スペクトルが破損して精度が低下したことです。あんな事はしないで。代わりに、録音した音を認識してください。

それでも無音化されていない領域をデコードする必要がある場合は、追加する必要があります

 dither="yes"

デコーダーがそれらを回避できるようにするために、デコーダー引数のオプション。このオプションを追加すると、結果が正確になります。

于 2013-04-16T16:56:47.227 に答える