“cmusphinx”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

2718 参照

performance - CMU スフィンクスのチューニング

CMU Sphinx に基づいて音声認識アプリを構築しようとしています。lmtool を使用して独自の言語モデルを作成しました。しかし、認識の精度を上げるために、Sphinx をチューニングしたいと考えています。しかし、absoluteBeamWidth、relativeBeamWidth、absoulteWordBeamWidth、languageWeight などのプロパティを選択するためのガイドラインはありますか。これらのプロパティが何を意味するのか正確にはわかりません。また、Sphinx のチューニングに役立つリソースへのリンク (Sphinx Web サイトの不完全なチューニングリンクを除く) も歓迎します。

ありがとうございました

2012-11-13T11:49:54.063

0 投票する

3 に答える

6572 参照

java - jsapi.jar を取得するにはどうすればよいですか

CMU Sphinx4 を使用するアプリケーションを開発していますが、PythonTranscriber を実行しようとすると、次のエラーが発生します。

ディレクトリ :"/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" に jsapi.jar がないことに気付きました。別のディレクトリで検索しようとしましたが、見つかりません。

ディレクトリ内で jsapi.jar を取得するにはどうすればよいですか:"/home/karen/sphinx4-1.0beta5-scr2/sphinx4-1.0beta/lib" そこにあるはずです! 助けてください！

java python jython cmusphinx

2012-11-14T22:56:13.540

0 投票する

1 に答える

372 参照

speech-recognition - 固定された小さな音声、言語に依存しない音声（またはコマンド）認識

計算の複雑さが低い認識エンジン（そしてできればFOSS）を探しています。これは、次の場合にうまく機能します。

固定セット/小語彙（最大100フレーズ）
言語に依存しない
不連続な音声/コマンド

エンジンが次の場合は問題ありません。

スピーカー依存
（したがって）事前トレーニングが必要です（認識を実行する前に）

計算の複雑さが低いということは、64MBのRAMを搭載した450MHzのARM9SBCで実行したいと思っていることを意味します。

speech-recognition speech cmusphinx

2012-11-19T05:11:49.343

0 投票する

0 に答える

293 参照

java - 2 つのアプリケーションを接続する

CMU Sphinx4 と Python で記述されたプログラムの 2 つのアプリケーションを実行中に接続する必要があります。

統合したくありません。両方のアプリ間で通信するだけです。

.pySphinxが認識した行をファイルに渡したい。

これどうやってするの？

java python voice-recognition cmusphinx

2012-11-19T22:50:05.293

0 投票する

1 に答える

554 参照

android - PocketSphinxAndroidDemo について

私はこのサイトに従っています: http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ . そして最初は正常に動作します。しかし、ファイル/ jni /でndk-buildをcmdすると. エラーは次のように表示されます。

android ubuntu cmusphinx

2012-11-22T14:28:54.783

0 投票する

1 に答える

373 参照

java - Ekigaソフトフォン/PulseaudioJACKシンクからの着信オーディオのキャプチャ

Sphinxを使って音声認識をしたいです。

JavaまたはPythonを使用してEkigaVOIPソフトフォンの出力/着信オーディオをキャプチャし、それをSphinxに渡すことを検討しています。現在、出力はPulseAudioJACKシンクに向けられています。

私はこれにかなりの初心者なので、正しい用語を使用していない場合は申し訳ありません。

私を正しい方向に向けていただければ幸いです。

java voip cmusphinx

2012-11-27T08:48:23.813

0 投票する

1 に答える

2248 参照

python - PocketSphinx pythonと音響モデルの設定？

音声認識に関するこのガイドを読んでいたところ、音声認識には音響モデル、言語モデル、音声辞書の3つの項目が必要であると書かれていました。

このPythonデモで遊び始めたいと思いました。このデモでは、Gstreamerを使用してマイクからキャプチャし、8kHzの16ビットPCMオーディオにリサンプリングします。

言語モデルと音声辞書を指定できることがわかり、[cmuが提供する]ものを使用します。

しかし、音響モデルをどこで指定すべきか混乱していますか？gstreamerには、暗黙的に使用している独自の音響モデルがありますか？少し良い結果を得るために、ここで提供されている音響モデルを使用したいと思っていました。

（ハイパーリンクについては申し訳ありません。担当者が10人未満のリンクを2つ以上投稿することはできません）

python speech-recognition cmusphinx

2012-11-30T21:22:48.523

0 投票する

1 に答える

2221 参照

java - Windows 7 (SphinxPocket) で autogen.sh と swig を実行する方法

Android アプリケーション用に Pocketsphinx をビルドしようとしていますが、いくつか問題があります。

autogen.sh、 autogen.sh を実行するプログラムは何ですか? cmd でインストールしようとすると、autogen.sh を実行するプログラムを選択するように求められます。何故ですか？Pocketsphinx を Android にビルドします-- mingw を使用して autogen.sh を実行しました。実行後、「make」しましたが、エラーが発生しました。

これは大丈夫ですか？そうでない場合、どうすればこれを解決できますか？

swig 、 CMDでHereの指示を試しましたが、swigを実行すると、「入力ファイルを指定する必要があります。使用可能なオプションには-helpを使用してください」と表示されます。Swig がインストールされているかどうかはどうすればわかりますか?

私はMINWGを使用してこの sphinxpocket を操作していますが、swig の操作方法はまだわかりません。

Windows 7 Home Basic 64 ビットを使用しています。ありがとう

java android windows cmd cmusphinx

2012-12-03T01:45:23.290

0 投票する

1 に答える

10859 参照

java - CMU Sphinx 4 入力用にオーディオファイルを変換する

CMU Sphinx 4 を使用して認識を実行したい大量のファイルがあります。Sphinx には次の形式が必要です。

16kHz
16ビット
単核症
リトルエンディアン

私のファイルは、44100 khz、32 ビットのステレオ mp3 ファイルのようなものです。Tritonus を使用してから、その更新版 JavaZoom を使用して、bakuzenのコードを使用して変換してみました。ただし、AudioSystem.getAudioInputStream(File)がスローUnsupportedAudioFileExceptionされ、理由がわからなかったので、先に進みました。

今、私はffmpegを試しています。このコマンドffmpeg -i input.mp3 -ac 1 -ab 16 -ar 16000 output.wavは (リトルエンディアンを除いて) トリックを実行するように見えますが、Audacity で出力を確認すると、まだ「32 ビットフロート」とラベル付けされています。このサイトで見つけたコマンドもを使用し-acodec pcm_s16leており、その名前から 16 ビットのリトルエンディアンを出力しているようです。ただし、Audacity はまだ出力が32 bit float.

オーディオファイルを CMU Sphinx 4 で必要な形式に変換する方法を誰か教えてもらえますか?

java audio ffmpeg speech-recognition cmusphinx

2012-12-03T22:36:15.840

問題タブ [cmusphinx]

Reference