問題タブ [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 英語版の voxforge モデルを使用したテキストへの音声変換に CMU Sphinx 4 を使用する方法
英語の voxforge モデルで sphinx4 または pocketphinx を使用する方法を理解しようとしていますが、うまくいきません。ドキュメント ページ (このようなhttp://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.htmlなど)を読み込もうとしましたが、役に立ちません。
私が欲しいのは、使用するモデルとソースとして使用するオーディオ ファイルを指定し、実行可能ファイルを印刷して、録音の声が何を言っているのかを推測できる実行可能ファイルです。
私はいくつかの運が良かった: pocketphinx_continuous -infile recording.wav 2> /dev/null
しかし、完全な音声ファイルが書き起こされる前に中止され、デフォルトのモデルでは、音声から読み取り可能なテキストを作成するための単語がほとんどありません。
私は sphinx4 ソース パッケージのデモをコンパイルしてテストしましたが、すべての例は単語が少ないようで、私にとって役立つには voxforge のようなモデルが必要です。
どうすればこれを設定できますか?
speech-recognition - Sphinx4を使用したディクテーションアプリケーション
質問は3歳になっているので、私の要件はこの質問に似ています。自分に固有の情報を使用して質問を再投稿しています。.wav(またはその他の標準オーディオファイル形式)を使用して変換するアプリケーションを作成したいと思います。テキストにそれ。
音声認識には、sphinx4を使用することにしました。これは、sphinxで提供されるTranscriberデモを強化しようとしています。それは良いですが、それは特定の文法(.gramおよび.gxmlファイルで書かれている)に対してのみ機能します。
編集 英語で使用できるようにするには?VoxForge_en_0.4で構成しようとしています。私のconfig.XMLファイルは次のようになります:-
私の設定に何か問題がありますか?Plzヘルプ...
c - アプリケーションでSphinx3を使用する方法
私はしばらくの間Sphinx4を使用しましたが、これは私のニーズにぴったりです。レコグナイザーをロードし、オーディオデータをレコグナイザーに渡し、認識された文字列をアプリケーションで使用します。
現在、私はCアプリケーション(C ++は残念ながらオプションではありません)に取り組んでいます。そこでは、似たようなものが必要で、Cで記述されたSphinx3を使用できると考えました。
問題は、アプリケーション内でどのように使用されているかがよくわからず、「HelloWorld」がないことです。たとえば、Sphinx4が提供している例です。
すでにsphinxbaseとsphinx3をコンパイルしてインストールしましたが、アプリケーションにsphinxヘッダーファイルをインクルードできるようになりました。
今私の質問に:
- C環境のsphinx3を使用する「シンプル」で十分に文書化されたサンプルアプリケーションはありますか?
- sphinx3エンジンをロードし、バイナリオーディオデータでレコグナイザーを呼び出すにはどうすればよいですか?
- または:「sphinx3_decode」のようなアプリケーションを起動して、自分のアプリケーションから呼び出す必要がありますか?もしそうなら、そのためのサンプルアプリケーションはありますか?
前もって感謝します!
よろしく、ロバート
mp3 - Sphinx 4 を使用した mp3 認識
wavファイルを使わずにmp3ファイルを音声認識処理に使用できますか? または、mp3 から wav ファイルを生成し、精度に深刻な影響を与えずに音声認識を実行できますか? 問題は、アプリケーションでネットワークを介して転送される負荷を最小限に抑える必要があることです。変換で失われる情報は、精度の大きな要因になりますか?
php - PHP ベースの e ショッピング CMS で CMU Sphinx を使用できますか?
CMS ベースの e ショッピング システムで、検索用の音声認識システムを統合したいと考えています。この CMS は Php で作成されています。では、CMU Sphinx は Php 統合をサポートしていますか? または、タスクを実行する他の方法はありますか?
python - python pocketphinxの単語タイムスタンプ
ubuntu 11.10でポケットフィンクスpythonバインディングを使用しています。文法と音声ファイルを渡すと、完全に機能します。現在、オーディオ ファイル内の各単語のタイムスタンプを探しています。私は見た:
私が必要とすることをするべきだと私は信じています。しかし、Pythonでこれを行う方法を見つけることができないようです。これは可能ですか?
python - Python 音声比較
2 つの .wav ファイルを比較して、同じ単語が含まれているかどうかを判断する必要があります (順序も同じです)。
私はしばらくの間、最善の方法を探してきました。pyspeech でファイルを入力として使用する方法がわかりません。CMU sphinx プロジェクトを動作させようとしましたが、GStreamer を Python 27 で動作させることはできないようです。プロジェクトは言うまでもありません。私はDragonFlyをいじりましたが、運がありません。
Python27でWin7 64ビットを使用しています。誰にもアイデアはありますか?
どんな助けでも大歓迎です。
java - Java sphinx プログラムのエラー
こんにちは、音声ソフトウェアを開発したい Java でソフトウェアを作成しています... Java で「Hello」スフィンクス コードを実行しています。
このプログラムを実行しようとすると、このエラーが発生しました...
提案してください...
ありがとう