問題タブ [mozilla-deepspeech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1181 参照

python - この DeepSpeech Python プログラムの結果が、コマンド ライン インターフェースから取得した結果と異なるのはなぜですか?

Mozilla の DeepSpeech Speech-To-Text エンジンについて学んでいます。コマンド ライン インターフェースは問題なく動作しましたが、Python インターフェースの動作が異なっているようです。私が実行すると:

sox で生成された PCM、16 ビット、モノラル 48000 Hz .wav ファイルでは、次のようになります。

「バナナ」を意味するときに「ベナナ」を差し引いたものは、テストした他のファイルと一緒に正常に動作するようです。このチュートリアルからの次のコードを使用しようとすると、問題が発生します。

次のコマンドでコードを実行します。

特定のファイルに応じて、異なる 4 文字の応答が得られます。この特定のファイルから得た応答は でし'hahm'たが、'hmhm'' eo'も一般的です。パラメータをモデル (25、9、および 500) に変更しても、出力は変わらないようです。

0 投票する
1 に答える
312 参照

tensorflow - 0.12 がインストールされているのに、Mozilla Deepspeech が Tensorflow 0.11 を使用するのはなぜですか?

私はpython 3.6でAnaconda3を使用し、pip install tensorflow deepspeechを使用しています。

次のコマンドを実行すると、エラーが発生します。

deepspeech --model models/output_graph.pb --alphabet models/alphabet.txt --audio voice.wav

このコマンドを使用して、手順から取得した事前トレーニング済みのモデルを使用していることに注意してください。

wget -O - https://github.com/mozilla/DeepSpeech/releases/download/v0.3.0/deepspeech-0.3.0-models.tar.gz | タール xvfz -

Tensorflow v1.11.0 はどこから来たのですか? ピップフリーズはTensorflowをv0.12.0と表示しますか? どうすればこれを回避できますか?