問題タブ [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - この音声認識コードに an4-1-1.match ファイルがないのはなぜですか?
音声認識のデコード部分に問題があります。ここの手順に従いました。次のように入力するperl scripts_pl/decode/slave.pl
と、次のエラーが表示されます。
MODULE: DECODE 以前にトレーニングされたモデルを使用したデコード 0 から始まる 130 セグメントのデコード (1 の 1) /scripts_pl/decode/../lib/SphinxTrain/Util.pm 299 行目。結果を整列してエラー率を見つけます /home/go/Documents/tutorial/an4/result/an4-1-1.match word_align を開けません。 pl は、scripts_pl/decode/slave.pl 行 173 でエラー コード 65280 で失敗しました。
179word_align.pl
行目です
そしてUtil.pm
299行目
-e $cmd; でない限り、「$cmd の実行可能ファイルが見つかりませんでした」。
が見つからないのはなぜan4-1-1.match file
ですか?
.net - サーバー上の音声認識エンジン。Sphinx VS .Net 音声認識
私は開発者であり
、音声認識エンジンを検索した私のウェブサイトの 1 つで.Net(Asp.Net)
必死に使用する必要があり、これまでのところメジャー 2 に出会いました。speech recognition
2. .Net Voice recognition
しかし、問題は、2 つのプラットフォームのいずれかについて読んだところで
、.Net の代替手段には継続的なディクテーションの前にトレーニングが必要であることがわかりました。私はすでに .Net 開発者であるため、これを好む傾向があります。
そして、2つの比較をどこで見つけることができませんでした。
.Net で sphinx のラッパーを開発したり、既に利用可能ないくつかの 1 つを使用したりすることは気にしません
が、それだけの価値はありますか?
比較が存在するリンク?
または、両方のフレームワークを使用した可能性のある人はいますか?
java - 奇妙なポケットフィンクスの精度低下
少しのコンテキスト - 私は jsgf 文法を使用して、android 用の pocketphinx アプリケーションを作成しています (ただし、fsg 文法でも問題は解決しません)。私のコードは、android 用の pocketphinx demo に基づいています。
Pocketsphinx は、エンジンに数回クエリを実行しただけで精度が低下するという奇妙な問題を引き起こしています。最初のクエリは、ほぼ完璧な精度で、比較的複雑で複雑なフレーズを問題なく認識できます。ただし、2 番目と 3 番目の認識では 2 音節の単語をほとんど検出できず、エンジンへの 4 番目のクエリまでに仮説を生成できません。
何が問題を引き起こしているのかよくわかりません。元のデモは問題なく動作しているように見えました。また、文法を追加する以外に、音声エンジンの構成をほとんど変更していません。とにかく、他の誰かがこのようなことを経験したことがありますか、それとも私がこれを改善しようとすることができるかについての提案さえありますか?
ありがとう
qt - SpeechMe のコンパイル方法
SpeechMe プロジェクトをコンパイルしようとしています: http://projects.developer.nokia.com/speechme/wikiで、作成したい別のプロジェクトで音声認識を使用できるようにします。
すべての指示に従い、Sphinxbase と Pocketsphinx の完全なソースをダウンロードし、それらを使用して不足しているすべてのファイルを SpeechMe に含まれる Sphinxbase および Pocketsphinx ディレクトリに追加しました。ウィキに書かれている順序でそれらをすべてコンパイルしたところ、すべて「***ビルド完了」が返されましたが、出力ファイルが生成されなかったようですか?
次に、Qt Creator で SpeechMe をコンパイルしようとしましたが、次の 3 つのエラーが表示されます。
すべての構成のビルド ログは次のとおりです: http://sdrv.ms/PxlD6r
助けてください、なぜこれが機能しないのか本当にわかりません!
grammar - 文法を使用して遅いポケットスフィンクス
私はCMUのPocketSphinxを使用して、Androidタブレットで音声認識を実行しようとしています。これを行うためのチュートリアルはここにあります。私の問題は、かなりのサイズの文法を使用すると、認識の実行が非常に遅くなることです。言語モデルを使用すると、優れた精度と速度を実現できるため、一時的な解決策は、文法から言語モデルを生成して使用することでした。
私の構成では、を設定し-bestpath = false
ました。その後、私は物事をスピードアップする方法について途方に暮れています。
明確化:大きな文法は初期化に時間がかかることは理解していますが、それを使用して認識を実行するのに長い時間はかからないと思います。
Pocket Sphinxと文法の使用経験があり、経験や構成などを共有できる人はいますか?
java - CMU Sphinx4 音素ディクテーション
ディクテーション内の音素のみを検出できるように sphinx4 を構成するにはどうすればよいですか?
部分的な結果については既に読みました
「デコーダーで構成変数「featureBlockSize」を設定することにより、結果リスナーが起動される頻度を制御できます。」
しかし、私の問題は、helloworld の例の hello.gram のように、常に必要な文法があることです。連続発話から音素を検出して認識できるようにする必要があります。
android - Sphinx4.0 を使用して音声認識を構築します。Android アプリケーション
私はEclipse IDEでSphinx4を使用して音声認識用のJavaアプリケーションを作成しており、うまくいきました! しかし今、私はプロジェクトを Android プラットフォームで動作させることを考えています。
コードは、sphinx4 デモの音声認識に適しています。Androidのプログラムですが、デバイスで実行しようとするとクラッシュします! 「予期せず停止しました!」と言っています。(強制閉鎖)
インターネットでの私の調査から、Sphinx が dalvik と互換性のない方法でマイクを構成していると聞きました。
SOこれら2つのことを一緒に動作させる方法はありますか?? dalvik デバイスでマイクを構成し、入力を処理するためだけに sphinx を使用するように??
speech-recognition - sphinx4音声認識の辞書ファイルで新しい単語を使用する際のエラー
私はすべてのsphinx4フォーラムとsource.afterからsphinx4音声認識を実装しようとしました
/ *
スレッド「main」の例外プロパティ例外コンポーネント:「dictionary」プロパティ:「dictionaryPath」
*/この問題を解決する方法を教えてください
android - CMU-Sphinx android ビルド エラー
最近、CMU-Sphinx for Android を使用しています。Web サイトからサンプル プロジェクトをビルドしようとすると、次のエラーが発生しました。
"thumb をコンパイルします: pocketphinx_jni <= pocketphinx_wrap.c
C:/CMUSphhinx/PocketSphinxAndroidDemo//jni/pocketsphinx_wrap.c: 関数 'nbest_s_hyp' 内: C:/CMUSphhinx/PocketSphinxAndroidDemo//jni/pocketsphinx_wrap.c:793:6: 警告: return はキャストなしの整数からポインターを作成します [有効デフォルトでは] C:/CMUSphhinx/PocketSphinxAndroidDemo//jni/pocketsphinx_wrap.c: 関数 'ps_decoder_s_getHyp' 内: C:/CMUSphhinx/PocketSphinxAndroidDemo//jni/pocketsphinx_wrap.c:847:3: 警告: return は整数からポインターを作成します。キャスト [デフォルトで有効] SharedLibrary : libpocketsphinx_jni.so
C:/CMUSphhinx/PocketSphinxAndroidDemo//obj/local/armeabi/objs/pocketsphinx_jni/pocketsphinx_wrap.o: 関数
nbest_s_hyp': C:/CMUSphhinx/PocketSphinxAndroidDemo//jni/pocketsphinx_wrap.c:793: undefined reference to
内 new_Hypothesis' C:/CMUSphhinx/PocketSphinxAndroidDemo//obj/local/armeabi/objs/pocketsphinx_jni/pocketsphinx_wrap.o: 関数内ps_decoder_s_getHyp': C:/CMUSphhinx/PocketSphinxAndroidDemo//jni/pocketsphinx_wrap.c:847: undefined reference to
new_Hypothesis の collect2: ld が 1 の終了ステータスを返しました make: * [C:/CMUSphhinx/PocketSphinxAndroidDemo//obj/local/armeabi/libpocketsphinx_jni.so] エラー 1
私はこれらのツールで Windows を使用しています: eclipse Indigo。アンドロイド 2.2 SDK アンドロイド ndkbuild-r8b swigwin-2.0.8
そして、これは私のEclipseでの構成です: SWIG: Main: C:\swigwin-2.0.8\swig.exe
NDK ビルド: メイン: C:\android-ndk-r8b\ndk-build.cmd
cmusphinx - pocketphinx 文法から単語を判別する方法
私は現在 Pocketphix デモ (Android と Visual Studio 2010) を使用しており、このような jsgf グラマーを構成しました
私が正しい名前を言うときはいつでも、ほとんどの場合それを正しく検出しますが、リストにない名前を言うと、それでも何かに一致し、それを望んでいないか、少なくとも文法にない何かが言われたかどうかを検出できるようにしたくありません (ポケットフィンクスのいくつかのスコアまたはAPIを介している可能性があります)
私はポケットフィンクスが私が知らないどこかにそれを持っていると確信しています. お知らせ下さい。
ありがとう、アーメド