問題タブ [cmusphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2718 参照

performance - CMU スフィンクスのチューニング

CMU Sphinx に基づいて音声認識アプリを構築しようとしています。lmtool を使用して独自の言語モデルを作成しました。しかし、認識の精度を上げるために、Sphinx をチューニングしたいと考えています。しかし、absoluteBeamWidth、relativeBeamWidth、absoulteWordBeamWidth、languageWeight などのプロパティを選択するためのガイドラインはありますか。これらのプロパティが何を意味するのか正確にはわかりません。また、Sphinx のチューニングに役立つリソースへのリンク (Sphinx Web サイトの不完全なチューニング リンクを除く) も歓迎します。

ありがとうございました

0 投票する
3 に答える
6572 参照

java - jsapi.jar を取得するにはどうすればよいですか

CMU Sphinx4 を使用するアプリケーションを開発していますが、PythonTranscriber を実行しようとすると、次のエラーが発生します。

ディレクトリ :"/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" に jsapi.jar がないことに気付きました。別のディレクトリで検索しようとしましたが、見つかりません。

ディレクトリ内で jsapi.jar を取得するにはどうすればよいですか:"/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" そこにあるはずです! 助けてください!

0 投票する
1 に答える
372 参照

speech-recognition - 固定された小さな音声、言語に依存しない音声(またはコマンド)認識

計算の複雑さが低い認識エンジン(そしてできればFOSS)を探しています。これは、次の場合にうまく機能します。

  1. 固定セット/小語彙(最大100フレーズ)
  2. 言語に依存しない
  3. 不連続な音声/コマンド

エンジンが次の場合は問題ありません。

  1. スピーカー依存
  2. (したがって)事前トレーニングが必要です(認識を実行する前に)

計算の複雑さが低いということは、64MBのRAMを搭載した450MHzのARM9SBCで実行したいと思っていることを意味します。

0 投票する
0 に答える
293 参照

java - 2 つのアプリケーションを接続する

CMU Sphinx4 と Python で記述されたプログラムの 2 つのアプリケーションを実行中に接続する必要があります。

統合したくありません。両方のアプリ間で通信するだけです。

.pySphinxが認識した行をファイルに渡したい。

これどうやってするの?

0 投票する
1 に答える
554 参照

android - PocketSphinxAndroidDemo について

私はこのサイトに従っています: http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ . そして最初は正常に動作します。しかし、ファイル/ jni /でndk-buildをcmdすると. エラーは次のように表示されます。

0 投票する
1 に答える
373 参照

java - Ekigaソフトフォン/PulseaudioJACKシンクからの着信オーディオのキャプチャ

Sphinxを使って音声認識をしたいです。

JavaまたはPythonを使用してEkigaVOIPソフトフォンの出力/着信オーディオをキャプチャし、それをSphinxに渡すことを検討しています。現在、出力はPulseAudioJACKシンクに向けられています。

私はこれにかなりの初心者なので、正しい用語を使用していない場合は申し訳ありません。

私を正しい方向に向けていただければ幸いです。

0 投票する
1 に答える
2248 参照

python - PocketSphinx pythonと音響モデルの設定?

音声認識に関するこのガイドを読んでいたところ、音声認識には音響モデル、言語モデル、音声辞書の3つの項目が必要であると書かれていました。

このPythonデモで遊び始めたいと思いました。このデモでは、Gstreamerを使用してマイクからキャプチャし、8kHzの16ビットPCMオーディオにリサンプリングします。

言語モデルと音声辞書を指定できることがわかり、[cmuが提供する]ものを使用します。

しかし、音響モデルをどこで指定すべきか混乱していますか?gstreamerには、暗黙的に使用している独自の音響モデルがありますか?少し良い結果を得るために、ここで提供されている音響モデルを使用したいと思っていました。

(ハイパーリンクについては申し訳ありません。担当者が10人未満のリンクを2つ以上投稿することはできません)

0 投票する
1 に答える
2221 参照

java - Windows 7 (SphinxPocket) で autogen.sh と swig を実行する方法

Android アプリケーション用に Pocketsphinx をビルドしようとしていますが、いくつか問題があります。

autogen.sh、 autogen.sh を実行するプログラムは何ですか? cmd でインストールしようとすると、autogen.sh を実行するプログラムを選択するように求められます。何故ですか?Pocketsphinx を Android にビルドします-- mingw を使用して autogen.sh を実行しました。実行後、「make」しましたが、エラーが発生しました。

これは大丈夫ですか?そうでない場合、どうすればこれを解決できますか?

swig 、 CMDでHereの指示を試しましたが、swigを実行すると、「入力ファイルを指定する必要があります。使用可能なオプションには-helpを使用してください」と表示されます。Swig がインストールされているかどうかはどうすればわかりますか?

私はMINWGを使用してこの sphinxpocket を操作していますが、swig の操作方法はまだわかりません。

Windows 7 Home Basic 64 ビットを使用しています。ありがとう

0 投票する
1 に答える
10859 参照

java - CMU Sphinx 4 入力用にオーディオ ファイルを変換する

CMU Sphinx 4 を使用して認識を実行したい大量のファイルがあります。Sphinx には次の形式が必要です。

  • 16kHz
  • 16ビット
  • 単核症
  • リトルエンディアン

私のファイルは、44100 khz、32 ビットのステレオ mp3 ファイルのようなものです。Tritonus を使用してから、その更新版 JavaZoom を使用して、bakuzenのコードを使用して変換してみました。ただし、AudioSystem.getAudioInputStream(File)がスローUnsupportedAudioFileExceptionされ、理由がわからなかったので、先に進みました。

今、私はffmpegを試しています。このコマンドffmpeg -i input.mp3 -ac 1 -ab 16 -ar 16000 output.wavは (リトル エンディアンを除いて) トリックを実行するように見えますが、Audacity で出力を確認すると、まだ「32 ビット フロート」とラベル付けされています。このサイトで見つけたコマンドも を使用し-acodec pcm_s16leており、その名前から 16 ビットのリトル エンディアンを出力しているようです。ただし、Audacity はまだ出力が32 bit float.

オーディオ ファイルを CMU Sphinx 4 で必要な形式に変換する方法を誰か教えてもらえますか?