問題タブ [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - Sphinx 音声認識の経験がある人はいますか?
Sphinx音声認識スタックを使用してIVR アプリケーションを構築した人はいますか? 私は、MSFT などの高価で多少制限のある選択肢に代わるオープン ソースの選択肢を探しています。オープン ソースの音声/音声アプリケーションを結び付ける包括的なパッケージを見つけることができませんでした。
multilingual - Sphinx音声認識機能での他の言語のサポート
私は、私たちのプロジェクトの1つでSphinx音声認識機能を分析しています。要件は、英語(米国)を含む6つの言語をサポートするテキストに音声を変換することです。これがSphinxで可能かどうか誰かが知っていますか?
Sphinxを選択した理由は、アプリケーションがWindows、Mac、およびLinuxプラットフォームと互換性があることを望んでいるためです。
speech-recognition - SphinxII認識読み取りおよび認識
Sphinx IIを使用して音声認識クライアントを実装しようとしています。私の目標は、誰かにテキストで書かれた文章を読んでもらい、各単語の信頼スコアを取得することです。そのために、私は有限状態文法と限定辞書を使用しています。
何かが機能するようになりましたが、信頼スコアは非常に低くなっています(<0.30)。Sphinx 2の単純なRecoの例と同じ設定を使用しています。発音される単語ごとに1つの可能性しかないため(各単語は文法の1つの状態です)、通常は高いスコアと時間効率の良い認識が必要ですが、仮説の計算には時間がかかります。また、単語が発音されるとすぐに仮説が立てられます。だから今、私はこれを改善するためにどこに行くべきか実際にはわかりません。私はこの種の問題に適切な解決策を使用していますか?代わりに言語モデルを使用する必要があります。使用する場合は、コンテキストをストーリー内の特定の文に制限する方法を教えてください。
また、スフィンクストレーナーを使用する必要がありますか?これまで、Webツールを使用して言語モデル/辞書を生成してきました。
あなたの助けをいただければ幸いです。ありがとう、Boris Gougeon
cmusphinx - どのように 2 logmath を同じ形式で 2 回使用するか (sphinx4)
私は、netbeans を使用してスフィンクスを構成し、正常に動作しています。しかし、ボタンを使用してプロセスを実行しています。しかし、それが認識した後。手続きをやり直したい。しかし、「logmathインスタンスはすでに存在しています」というエラーが表示され、マイクを開くことができません。
誰かが私に解決策を教えてもらえますか。私がやりたいのは、音声認識を同じ形式で数回使用することです。正しい答えが出るまで。
私を助けてください
これは私が得るエラーです
「別のインスタンスが既に存在している間に LogMath の新しいインスタンスを作成しています 10:53:27.833 SEVERE マイク PCM_SIGNED 16000.0 Hz、16 ビット、モノラル、2 バイト/フレーム、ビッグエンディアンがサポートされていない形式のマイク ラインを開けません。」
android - Androidのポケットスフィンクス
AndroidでPocketSphinxを使用するために必要な手順は何ですか?
私はそれが可能であるというウェブの周りの様々なヒントを見つけましたが、本当の答えではないので、ここで私の質問をします。
java - sphinx4 をメモ帳でセットアップする方法
メモ帳でsphinx4をセットアップする方法を教えてください。HelloWorld の例を実行しようとしてから数日経ちますが、うまくいきません。すべてのライブラリを ../jre/lib/ext フォルダーに設定しましたが、それでも次のエラーが発生します。
*スレッド「メイン」の例外 java.lang.NoClassDefFoundError: edu/cmu/sphinx/util/props/ConfigurationManager
原因: java.lang.ClassNotFoundException: edu.cmu.sphinx.util.props.ConfigurationManager
HelloWorld.java:33 は次の行です。
cm = new ConfigurationManager(HelloWorld.class.getResource("helloworld.config.xml"));
誰か手を貸してくれませんか?
java - AndroidへのPocketsphinxのインストール
PocketsphinxをAndroidスマートフォンにインストールすることについていくつか質問がありますが、CMUSphinxのサポートフォーラム、IRC、既存のStackOverflowの投稿、または集中的なグーグルで回答を見つけることができませんでした。ここにいる人が少しでも助けてくれるなら、私はそれを大いに感謝します。
まず、AndroidにPocketsphinxをインストールできるかどうかについて混乱しています。Androidで実行するにはJavaビンが必要だと思うので、Sphinx 4をインストールしようとしました。プログラムをテストするために、空のアクティビティを作成し、HelloWorldデモファイルをonCreateメソッドに移動しました。
次に、ビルドパスに次のライブラリを追加しました。
- js.jar
- jsapi-1.0-base.jar
- junit-4.8.1.jar
- sphinx4.jar
- tags.jar
- WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz.jar
コードはAndroid2.2を実行しているDroid2にデプロイされますが、実行時に次のエラーが発生します。
そのjarファイルをビルドパスに含めているので、なぜそれが例外をスローするのかわかりません。しかし、繰り返しになりますが、AndroidにSphinx4をインストールしようとしているのかどうかさえわかりません。誰かが私が何をすべきか知っていますか?よろしくお願いします。
2011年5月の更新:Androidでpocketsphinxを実行するために行った試みは、CMU Sphinx wiki(http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ )にリストされています。
xml - sphinx4 は文法を構築するためにどのような方法を使用しますか?
sphinx4
文法を構築するためにどのような方法を使用しますか? XML
または拡張BNF
?
speech-recognition - CMU Sphinx 用の大語彙言語モデルを構築するにはどうすればよいですか?
CMU Sphinx の言語モデルを構築したいのですが、コーパスが 1000 語を超えているため、オンライン ツールを使用できません。(cmuclmtk のスクリプト?) を使用して言語モデルを構築するにはどうすればよいですか?
c# - .net での音声認識。スフィンクス、ISIP、ユリウス
C# で記述されたアプリケーションに音声認識機能を実装したいと考えています。System.Speech.Recognition は、サポートする言語の数が十分でないため、適切ではありません。
いくつかのエンジンを見つけましたが、それらは .net で書かれておらず、ラッパーも見つかりません。では、Sphinx、ISIP、Julius のどれを使用しますか? それらの .net ラッパーを知っていますか? 役立つチュートリアルや記事を知っていますか?
前もって感謝します