問題タブ [cmusphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2151 参照

speech-recognition - CMU Shinx、JSAPI、Google Speech API を使用した音声認識

音声認識は、私の現在のプロジェクトの多くの機能の 1 つであり、J2EE で開発される可能性が最も高いでしょう (選択が正当化されれば、他の言語も歓迎されます)。

GoogleSOのリンクのほとんどは、上記の 3 つのオプション、Sphinx 4、JSAPI 直接、および Google Speech API (Google にサーバー呼び出しを行い、結果をテキストとして取得するよりも) を提案しています。

他に自由に利用できるオプションは何ですか? また、Sphinx-4 を使用する場合、一般的な英語を使用するための言語モデルを取得するにはどうすればよいですか?

0 投票する
1 に答える
27557 参照

java - 英語版の voxforge モデルを使用したテキストへの音声変換に CMU Sphinx 4 を使用する方法

英語の voxforge モデルで sphinx4 または pocketphinx を使用する方法を理解しようとしていますが、うまくいきません。ドキュメント ページ (このようなhttp://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.htmlなど)を読み込もうとしましたが、役に立ちません。

私が欲しいのは、使用するモデルとソースとして使用するオーディオ ファイルを指定し、実行可能ファイルを印刷して、録音の声が何を言っているのかを推測できる実行可能ファイルです。

私はいくつかの運が良かった: pocketphinx_continuous -infile recording.wav 2> /dev/null

しかし、完全な音声ファイルが書き起こされる前に中止され、デフォルトのモデルでは、音声から読み取り可能なテキストを作成するための単語がほとんどありません。

私は sphinx4 ソース パッケージのデモをコンパイルしてテストしましたが、すべての例は単語が少ないようで、私にとって役立つには voxforge のようなモデルが必要です。

どうすればこれを設定できますか?

0 投票する
1 に答える
6162 参照

speech-recognition - Sphinx4を使用したディクテーションアプリケーション

質問は3歳になっているので、私の要件はこの質問に似ています。自分に固有の情報を使用して質問を再投稿しています。.wav(またはその他の標準オーディオファイル形式)を使用して変換するアプリケーションを作成したいと思います。テキストにそれ。

音声認識には、sphinx4を使用することにしました。これは、sphinxで提供されるTranscriberデモを強化しようとしています。それは良いですが、それは特定の文法(.gramおよび.gxmlファイルで書かれている)に対してのみ機能します。

編集 英語で使用できるようにするには?VoxForge_en_0.4で構成しようとしています。私のconfig.XMLファイルは次のようになります:-

私の設定に何か問題がありますか?Plzヘルプ...

0 投票する
2 に答える
2343 参照

c - アプリケーションでSphinx3を使用する方法

私はしばらくの間Sphinx4を使用しましたが、これは私のニーズにぴったりです。レコグナイザーをロードし、オーディオデータをレコグナイザーに渡し、認識された文字列をアプリケーションで使用します。

現在、私はCアプリケーション(C ++は残念ながらオプションではありません)に取り組んでいます。そこでは、似たようなものが必要で、Cで記述されたSphinx3を使用できると考えました。

問題は、アプリケーション内でどのように使用されているかがよくわからず、「HelloWorld」がないことです。たとえば、Sphinx4が提供している例です。

すでにsphinxbaseとsphinx3をコンパイルしてインストールしましたが、アプリケーションにsphinxヘッダーファイルをインクルードできるようになりました。

今私の質問に:

  • C環境のsphinx3を使用する「シンプル」で十分に文書化されたサンプルアプリケーションはありますか?
  • sphinx3エンジンをロードし、バイナリオーディオデータでレコグナイザーを呼び出すにはどうすればよいですか?
  • または:「sphinx3_decode」のようなアプリケーションを起動して、自分のアプリケーションから呼び出す必要がありますか?もしそうなら、そのためのサンプルアプリケーションはありますか?

前もって感謝します!

よろしく、ロバート

0 投票する
1 に答える
1325 参照

mp3 - Sphinx 4 を使用した mp3 認識

wavファイルを使わずにmp3ファイルを音声認識処理に使用できますか? または、mp3 から wav ファイルを生成し、精度に深刻な影響を与えずに音声認識を実行できますか? 問題は、アプリケーションでネットワークを介して転送される負荷を最小限に抑える必要があることです。変換で失われる情報は、精度の大きな要因になりますか?

0 投票する
1 に答える
1291 参照

php - PHP ベースの e ショッピング CMS で CMU Sphinx を使用できますか?

CMS ベースの e ショッピング システムで、検索用の音声認識システムを統合したいと考えています。この CMS は Php で作成されています。では、CMU Sphinx は Php 統合をサポートしていますか? または、タスクを実行する他の方法はありますか?

0 投票する
1 に答える
627 参照

cmusphinx - CMUSphhinx プログラムを実行できません

このブログ (ここ)を使用して CMU​​Sphinx をインストールしました。すべての手順を正しく行いました。しかし、同じブログで提供されているサンプルプログラムを実行したところ(このプログラム)。次のエラーが表示されます

--------- エラー: ---------- ベイダーを作成できません。初期化に失敗しました...

どうすればいいのかわからない。Ubuntu 11.10/64bit を使用しています。インストールしていないパッケージはありますか?

0 投票する
1 に答える
1199 参照

python - python pocketphinxの単語タイムスタンプ

ubuntu 11.10でポケットフィンクスpythonバインディングを使用しています。文法と音声ファイルを渡すと、完全に機能します。現在、オーディオ ファイル内の各単語のタイムスタンプを探しています。私は見た:

私が必要とすることをするべきだと私は信じています。しかし、Pythonでこれを行う方法を見つけることができないようです。これは可能ですか?

0 投票する
1 に答える
3037 参照

python - Python 音声比較

2 つの .wav ファイルを比較して、同じ単語が含まれているかどうかを判断する必要があります (順序も同じです)。

私はしばらくの間、最善の方法を探してきました。pyspeech でファイルを入力として使用する方法がわかりません。CMU sphinx プロジェクトを動作させようとしましたが、GStreamer を Python 27 で動作させることはできないようです。プロジェクトは言うまでもありません。私はDragonFlyをいじりましたが、運がありません。

Python27でWin7 64ビットを使用しています。誰にもアイデアはありますか?

どんな助けでも大歓迎です。

0 投票する
3 に答える
2632 参照

java - Java sphinx プログラムのエラー

こんにちは、音声ソフトウェアを開発したい Java でソフトウェアを作成しています... Java で「Hello」スフィンクス コードを実行しています。

このプログラムを実行しようとすると、このエラーが発生しました...

提案してください...

ありがとう