問題タブ [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - Sphinx4を使用したディクテーションアプリケーション
質問は3歳になっているので、私の要件はこの質問に似ています。自分に固有の情報を使用して質問を再投稿しています。.wav(またはその他の標準オーディオファイル形式)を使用して変換するアプリケーションを作成したいと思います。テキストにそれ。
音声認識には、sphinx4を使用することにしました。これは、sphinxで提供されるTranscriberデモを強化しようとしています。それは良いですが、それは特定の文法(.gramおよび.gxmlファイルで書かれている)に対してのみ機能します。
編集 英語で使用できるようにするには?VoxForge_en_0.4で構成しようとしています。私のconfig.XMLファイルは次のようになります:-
私の設定に何か問題がありますか?Plzヘルプ...
c - アプリケーションでSphinx3を使用する方法
私はしばらくの間Sphinx4を使用しましたが、これは私のニーズにぴったりです。レコグナイザーをロードし、オーディオデータをレコグナイザーに渡し、認識された文字列をアプリケーションで使用します。
現在、私はCアプリケーション(C ++は残念ながらオプションではありません)に取り組んでいます。そこでは、似たようなものが必要で、Cで記述されたSphinx3を使用できると考えました。
問題は、アプリケーション内でどのように使用されているかがよくわからず、「HelloWorld」がないことです。たとえば、Sphinx4が提供している例です。
すでにsphinxbaseとsphinx3をコンパイルしてインストールしましたが、アプリケーションにsphinxヘッダーファイルをインクルードできるようになりました。
今私の質問に:
- C環境のsphinx3を使用する「シンプル」で十分に文書化されたサンプルアプリケーションはありますか?
- sphinx3エンジンをロードし、バイナリオーディオデータでレコグナイザーを呼び出すにはどうすればよいですか?
- または:「sphinx3_decode」のようなアプリケーションを起動して、自分のアプリケーションから呼び出す必要がありますか?もしそうなら、そのためのサンプルアプリケーションはありますか?
前もって感謝します!
よろしく、ロバート
mp3 - Sphinx 4 を使用した mp3 認識
wavファイルを使わずにmp3ファイルを音声認識処理に使用できますか? または、mp3 から wav ファイルを生成し、精度に深刻な影響を与えずに音声認識を実行できますか? 問題は、アプリケーションでネットワークを介して転送される負荷を最小限に抑える必要があることです。変換で失われる情報は、精度の大きな要因になりますか?
php - PHP ベースの e ショッピング CMS で CMU Sphinx を使用できますか?
CMS ベースの e ショッピング システムで、検索用の音声認識システムを統合したいと考えています。この CMS は Php で作成されています。では、CMU Sphinx は Php 統合をサポートしていますか? または、タスクを実行する他の方法はありますか?
python - python pocketphinxの単語タイムスタンプ
ubuntu 11.10でポケットフィンクスpythonバインディングを使用しています。文法と音声ファイルを渡すと、完全に機能します。現在、オーディオ ファイル内の各単語のタイムスタンプを探しています。私は見た:
私が必要とすることをするべきだと私は信じています。しかし、Pythonでこれを行う方法を見つけることができないようです。これは可能ですか?
python - Python 音声比較
2 つの .wav ファイルを比較して、同じ単語が含まれているかどうかを判断する必要があります (順序も同じです)。
私はしばらくの間、最善の方法を探してきました。pyspeech でファイルを入力として使用する方法がわかりません。CMU sphinx プロジェクトを動作させようとしましたが、GStreamer を Python 27 で動作させることはできないようです。プロジェクトは言うまでもありません。私はDragonFlyをいじりましたが、運がありません。
Python27でWin7 64ビットを使用しています。誰にもアイデアはありますか?
どんな助けでも大歓迎です。
java - Java sphinx プログラムのエラー
こんにちは、音声ソフトウェアを開発したい Java でソフトウェアを作成しています... Java で「Hello」スフィンクス コードを実行しています。
このプログラムを実行しようとすると、このエラーが発生しました...
提案してください...
ありがとう
python - PythonでpocketSphinxの言語モデルを選択する方法
Linuxに音声認識ライブラリが必要です。次に、CMU Sphinxを選択し、PythonでpocketSphinxを使用します。そのデモをテストします。この例は、私のコンピューターでは精度が低く、うまく機能します。
言語モデルが必要なことはわかっていて、ダウンロードしました。だから、私のpocketSphinxを設定する方法はその「lm」を使用します。つまり、その言語モデルを使用するようにそのデモファイルを修正する方法です。(および音響モデル。)
どうもありがとうございます!
android - Pocketsphinx デモ プロジェクトの実行に問題がありますか? セグメンテーション エラーですか?
私はここにいるのは初めてで、Pocketsphinx (NDK を使用) を使用した Android アプリで助けが得られることを願っています。
私は GPS を作成している学校のプロジェクトのためにこの作業を行っており、オフラインの音声認識を追加したいと考えていました。
静かに多くの修正と試行を行った後 (最初に Ubuntu のインストールと慣れ、ライブラリをコンパイルしようとしたときに発生したエラーの修正、.so ファイルを取得するために NDK でライブラリをビルドしようとした際のエラー、プロジェクトの問題Android用の適切なライブラリがなく、それを2.1プロジェクトに変換して電話でテストしました)プログラムを実行できました(ただし、何らかの理由で、電話に表示される前に2回3回起動する必要があります) .
デモプロジェクトを使用しようとすると問題が発生します。見た目がわからない場合は、単純なテキスト領域とボタンだけです。ボタンを押すと録音が開始され、話すと入力された音声が表示されますエリア内のテキストとして、このボタンをクリックするとすぐに閉じます。クラッシュしません。プロセスは停止しますが、スタックトレースは取得できません。デバッグ情報からわかることから、記録プロセスを開始しますが、その後クラッシュします。私の推測では、ネイティブ コードで作業を開始しようとするとクラッシュします。
私が取得した不明確なデバッグ情報から理解できることは、ネイティブ環境が閉じられていることです。タグ Zygote を含むデバッグからメッセージが表示され、「プロセス X はシグナルによって終了しました(11)」というメッセージが表示されます。私の検索から、これはセグメンテーション違反 (SIGSEGV) を意味する可能性が最も高いことがわかりました。
これは私が得た限りであり、セグメンテーション違反が何を意味するのか、この問題を解決する方法を本当に理解していません. 以下にログの一部を追加します。これは、プログラムが終了する前に表示されるものです。ログからの情報がさらに必要な場合は、どの情報が役立つかが非常にわからないため、何をどのように取得するか教えてください。
私は Eclipse と Android プラグインを使用して Ubuntu 11.10 に取り組んでいます。関連する場合、私の電話は Sony Ericsson Xperia であり、Android 2.1 のいくつかの Sony Ericsson バージョンを実行しています。sphinx ライブラリは Sphinx プロジェクト Web サイトの最新バージョンです。
ここの誰かがこれに取り組み続ける方法を教えてくれることを願っています。私は主に Java 開発者ですが、C++ でいくつかの作業を行ったことがあります。そこまで行く。
ログの抜粋は次のとおりです。
私は答えを見つけようとしてきましたが、見つけたほとんどのスレッドはアプリからログファイルを調べるように求められましたが、それらは通常スレッドの終わりでした.私のプロジェクトはログファイルを提供しません(作成するコードが1つはそこにあります)。私は次にどこを見ればよいか途方に暮れています。ここにいる誰かが私に手を差し伸べてくれることを願っています。