問題タブ [mozilla-deepspeech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - この DeepSpeech Python プログラムの結果が、コマンド ライン インターフェースから取得した結果と異なるのはなぜですか?
Mozilla の DeepSpeech Speech-To-Text エンジンについて学んでいます。コマンド ライン インターフェースは問題なく動作しましたが、Python インターフェースの動作が異なっているようです。私が実行すると:
sox で生成された PCM、16 ビット、モノラル 48000 Hz .wav ファイルでは、次のようになります。
「バナナ」を意味するときに「ベナナ」を差し引いたものは、テストした他のファイルと一緒に正常に動作するようです。このチュートリアルからの次のコードを使用しようとすると、問題が発生します。
次のコマンドでコードを実行します。
特定のファイルに応じて、異なる 4 文字の応答が得られます。この特定のファイルから得た応答は でし'hahm'
たが、'hmhm'
と' eo'
も一般的です。パラメータをモデル (25、9、および 500) に変更しても、出力は変わらないようです。
tensorflow - 0.12 がインストールされているのに、Mozilla Deepspeech が Tensorflow 0.11 を使用するのはなぜですか?
私はpython 3.6でAnaconda3を使用し、pip install tensorflow deepspeechを使用しています。
次のコマンドを実行すると、エラーが発生します。
deepspeech --model models/output_graph.pb --alphabet models/alphabet.txt --audio voice.wav
このコマンドを使用して、手順から取得した事前トレーニング済みのモデルを使用していることに注意してください。
wget -O - https://github.com/mozilla/DeepSpeech/releases/download/v0.3.0/deepspeech-0.3.0-models.tar.gz | タール xvfz -
Tensorflow v1.11.0 はどこから来たのですか? ピップフリーズはTensorflowをv0.12.0と表示しますか? どうすればこれを回避できますか?