問題タブ [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - .net での音声認識。スフィンクス、ISIP、ユリウス
C# で記述されたアプリケーションに音声認識機能を実装したいと考えています。System.Speech.Recognition は、サポートする言語の数が十分でないため、適切ではありません。
いくつかのエンジンを見つけましたが、それらは .net で書かれておらず、ラッパーも見つかりません。では、Sphinx、ISIP、Julius のどれを使用しますか? それらの .net ラッパーを知っていますか? 役立つチュートリアルや記事を知っていますか?
前もって感謝します
speech-recognition - 50,000 ワードの ARPA 言語モデル ファイルの作成
50,000 語近くの ARPA 言語モデル ファイルを作成したいと考えています。テキスト ファイルを CMU 言語ツールに渡して言語モデルを生成できません。これらの多くの単語の言語モデルを取得できる他のリンクはありますか?
speech-recognition - Sphinx 4 (ベータ バージョン 6) の hello-world デモで一貫性のない認識精度
Sphinx4 (ベータ バージョン 6) の 'Hello World' デモが常にうまく動作しないのはなぜですか?
Programmer's Guide やその他の情報源を確認しましたが、問題は私の問題ではないようです。
java - スフィンクスの音声認識遅延
オープン ソースの sphinx SDK を使用して音声認識を行っています。現在、HelloWorld の例を実行しています。ただし、応答は非常に遅く、単語を認識するのに数回の試行が必要であり、認識されることもありますが、私が言ったことを出力するのに少し時間がかかります。これを改善する方法はありますか?また、文法ファイルを変更しても、更新されず、新しい単語が認識されません。
ありがとう
iphone - iPhoneで中国語の音声認識を行う方法
OpenEarsは中国語の音声認識を行うことができますか?ここを参照してください:http ://www.politepix.com/openears
speech-recognition - CMU の sphinx4 を使用して数字以外のデータを転記する
私は最近、書き起こしに CMU の sphinx4 を使用することに取り組んでおり、最終的に強制的に整列させます。つまり、音声をその書き起こしに合わせます。
基本的に私が開発したいことを実行するAutoCapというプロジェクトを見つけました。ということで、インストールしましたがダメでした。微調整してみましたが、取得したのは間違ったタイムスタンプだけでした。
そこで、sphinx4 を使って自分でやってみようと思いました。Sphinx の Transcriber.jar ファイルを使用して、wav ファイルの書き起こしに成功しました。しかし、数字以外のデータを含むオーディオでは機能しませんでした。readmeページには、「数字以外のデータを転記したい人は、正しい文法、言語モデル、および言語学者を使用して config.xml ファイルを変更する必要があります」と記載されています。
それで、誰でもこれらのいずれかについて私に助けを提供できますか:
- オートキャップ
- Sphinx4 を使用して数字以外のデータを転記する
- 強制整列
ありがとう。
java - 歌いながら連続音声認識?
私のアプリケーションの一部として、音声認識を追加しようとしていますが、実際には従来の意味ではありません。誰かが歌っている歌詞 (詩に分かれている) がたくさんありますが、その考えは、現在歌われている詩を見つけて、画面に表示できるようにすることです。
私はスフィンクスで遊んで、いくつかの基本的な例をセットアップして動作させましたが、遅延を待ってから結果を処理できる音声テキストの登録に関するドキュメントがたくさんあるようですが、あまり見つけられません文を連続的に認識するという考え。これはもちろん、言葉が歌われ、話されていない部分に到達する前のことです!
誰かがこれを経験したことがありますか?もしそうなら、良い出発点を提供する場所はありますか? それとも、私が達成しようとしていることがスフィンクスであまりにも野心的であり、実際に適切に機能することはありませんか? 私は他のライブラリを見ることにもオープンですが、それらは無料である必要があり、Sphinx は私が掘り下げることができるライブラリについて最も広く話題になっていました。
voice-recognition - 音声認識でarpaファイルを使用する方法
CMUSLMツールキットを使用してテキストファイルからARPAファイルを作成しました。
.lm
現在、プロジェクトで生成されたARPAファイルをandfileの代わりに使用する方法がわかりません.dic
。
誰かがそれについて知っているなら、私に知らせてください。
speech-recognition - sphinx4では音声認識応答が悪い
現在、音声認識にsphinx4を使用することを検討しています。ディクテーションタイプのアプリケーションに対して、良好な応答を実現しようとしています。入力はwavファイルであり、それを転記したいと思います。Sphinx4が提供するLatticeDemoとTranscriberのデモを調べました。同じ構成を使用すると、応答がかなり悪くなります。設定ファイルを微調整しようとしましたが、単語が認識されません。提供されている転記者のデモは数字用です。単語を理解できるように構成ファイルを変更しました。しかし、何かが足りないのかどうかはわかりません。設定ファイルを添付しました。できる限りの改善を提案してください。