問題タブ [cmusphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dictionary - Simple Word を辞書の発音のように Sphinx4 WSJ に変換するには?
私はこの Sphinx4 音声認識に行き着きました.sphinx4 の helloworld デモで実装しました. 今欲しいのは動的辞書を作成することです 入力として与えられたテキスト ファイル用に.テキストファイルをIMTOOLSにアップロードすると、.Dictファイルが提供されます。
しかし、私の要件は、ユーザーがテキストボックスに任意のテキストを入力して変換ボタンをクリックすると、その単語が発音単語のような WSJ Dcitionary に自動的に変換されるようなものです。\ EG ユーザーは、認識したい単語をテキストボックスに入力して、" ANKIT」を実行すると、その単語が「AE NG K AH T」のような形式の wsj 辞書に自動的に変換されます。誰でも私を助けてくれますか?または何か提案がありますか?私はそのようにしたい...あなたが適切な方法で理解できるように私が良い方法で説明し、私に返信してくれることを願っています..」
このサービスを支払いで提供している場合でも、問題ありません...
java - EclipseでのSphinx4ベータAPIの問題
Sphinx 4.0(明らかにベータ版ですか?)を使用して簡単なhelloworldデモをセットアップしようとしています。ソースをダウンロードして、ソースとしてEclipseに追加しましたが、問題は、多くのクラスを認識しないことです。私はずっと探していました、そして私が知る限り、それが望むクラスはただそこにありません!たとえば、次の行です。
インポートを解決できなかった方法について何かを言って、コンパイラエラーをスローします。これは、Sphinx4を実行する前にダウンロードすることになっていたより大きなAPIの一部ですか?他のAPIについては何も述べていませんが、私はその可能性を受け入れています。
必要に応じて、解決できないすべてのインポートのリストを投稿できますが、それは、一種の苦痛であるすべてのコードを調べることを意味します。JSAPIをダウンロードする必要があるという予感がありますが、どの実装がSphinx4に適しているかわかりません。
Sphinx4ダウンロードへのリンク:
http://sourceforge.net/projects/cmusphinx/files/sphinx4/1.0%20beta6/
http://cmusphinx.sourceforge.net/
編集:さらに、JUnitをダウンロードする必要があると思われる行をいくつか見つけましたか?繰り返しますが、これを設定する方法が完全にはわかりません。
speech-recognition - Sphinx4 音素セグメンテーション
単語または文の各音素からの開始フレーム、終了フレーム、およびセグメンテーション スコアが必要なシステムを開発しています。私は Sphinx-3 コマンド sphinx3_align を使用して、次の結果を取得しました (例):
問題は、このコマンドを何度も実行する必要があり、サーバーで多くのメモリを消費していることです。制御ファイルに多くの入力を渡そうとしましたが、処理に時間がかかり、アプリケーションの応答時間を長くすることができません。
そのため、応答時間を維持しながら消費するメモリを減らすために、同じシステムを Sphinx-4 に実装しようとしています。このようにして、アプリケーションを実行するたびにアンロードすることなく、アライメントの直後に結果を返すことができます。
私の疑問は、Sphinx-4 で上記の出力 (sphinx3_align と同様) を持つことができるかどうかです。
windows - Windows 7 の Sphinxtrain スナップショット
Windows 7 コンピューターに sphinxbase.tar.gz と sphinxtrain.tar.gz をダウンロードしました。Visual Studio 2010 でビルドします。Activeperl、python 3.3 をインストールしました。
チュートリアルhttp://cmusphinx.sourceforge.net/wiki/tutorialamでは、次のように書かれています。
sphinxtrain スナップショットの場合
おそらくLinuxシステム用です。Windows 7 (64 ビット) で sphinxtrain (スナップショット) を実行するにはどうすればよいですか?
java - wav をケプストラムに変換することによる Shpinx 4 キーワード スポッティング関数の精度の低下
私はキーワード スポッティング システムを構築しようとしていますが、プロジェクトの基盤として、sphinx 4 のブランチであるこれを選択しました。
wav ファイルで適切に動作します (単一のキーワードで少なくとも 70%)。しかし、クライアントからサーバーにファイルを送信する時間を節約するために、最初にクライアント側で wav ファイルをケプストラムに変換してから、ケプストラムを送信することにしました。この作業はFeaturefiledumperによって実行されます。
しかし、ケプストラムを元の KWS システムにロードすると、その精度はひどいものになります。クライアントにいくつかの作品を入れただけで、精度にはそれほど影響しないはずだと思っていました。元の KWS システムは、各単語を適切なブロックに分割して認識できます。スペクトルを入力として使用した後、システムはすべての単語を適切に分割することさえできません。それが高精度を出せない理由でもあると思います。
ファイル送信の時間を節約しながら、KWS システムの妥当な精度を維持する方法を見つけたいと考えています。構成で見逃したものはありますか、それともニーズを満たす別の方法がありますか?
クライアント側の構成は次のとおりです。
サーバー側の構成は次のとおりです。
================================================== ================
ニコライに感謝します。その理由は、ファイルを処理するための異なるコンポーネント (StreamDataSource と AudioFileDataSource) であることがわかりました。
しかし、問題があります。私のクライアントは Android システムです。javax.sound.sampled クラスには対応していません。したがって、クライアントで AudioFileDataSource を使用することはできません。StreamDataSource は可能な解決策です。しかし、これら 2 つのコンポーネントが異なる機能セットをもたらす理由がわかりません。
StreamDataSource に AudioFileDataSource と同じ結果を生成させるヒントはありますか?
python - MacOSXでのPocketSphinxのセットアップ
で、デフォルトとEnthought Python 2.7
同様に実行しています。で音声テキスト変換を開発しようとしています。仕事に必要なを使って録音できるので使っています。Python 2.7
Xcode 4.5.1
Mac OS 10.8.2
Python
Enthought Python
16000Hz, 1 Channel
pyaudio
pocketsphinx
pocketsphinx
を使用してセットアップしようとしていますbrew install pocketsphinx
。
次のエラーが発生します
make
デフォルトを使用して手動でインストールしてもpython
、同じエラーが発生
します
ブリュードクターを使って、
どうすれば正常にインストールできpocketsphinx
ますか?
これが私のconfig.logです
ruby-on-rails - Ruby アプリケーションで CMU Sphinx 音声認識を使用するには?
Ruby (Rails) アプリケーションで CMU Sphinx を使用する方法を探しています。私は非常に単純なタスクを必要としています - 私は mp3 ファイルを持っていて、それをテキストに書き起こしたいと思っています。
この最も簡単な方法を実装するにはどうすればよいですか? 私は C/C++ を知りませんし、私の仕事は C/C++ を学ぶほど大きなものではありません :)
手伝ってくれてありがとう!
java - jar ファイルをクラスパスに含める
Sphinx の HelloWOrd プログラムを実行しようとしていますが、動作させるには .jar ファイルが必要です。
クラスパスにjarファイルを追加しようとしていますが、いくつかのエラーが発生しています
contend.util が存在しません import edu.cmu.sphinx.frontend.util.Microphone; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:4: パッケージ edu.cmu.sphinx.recognizer が存在しません import edu.cmu.sphinx.recognizer.Recognizer; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:5: パッケージ edu.cmu.sphinx.result が存在しません import edu.cmu.sphinx.result.Result; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:6: パッケージ edu.cmu.sphinx.util.props が存在しません import edu.cmu.sphinx.util.props.ConfigurationManager; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:11: シンボル symbol が見つかりません: クラス ConfigurationManager 場所: クラス hola. HelloWorld ConfigurationManager cm; ^ home/karen/workspace/hola/src/hola/HelloWorld.java:14: シンボル symbol が見つかりません: class ConfigurationManager 場所: class hola.HelloWorld cm = new ConfigurationManager(args[0]); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:16: シンボル symbol が見つかりません: クラス ConfigurationManager 場所: クラス hola.HelloWorld cm = new ConfigurationManager(HelloWorld.class.getResource("helloworld.config.xml") )); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:19: シンボル symbol が見つかりません: class Recognizer の場所: class hola.HelloWorld ^ home/karen/workspace/hola/src/hola/HelloWorld.java:19: シンボル symbol が見つかりません: class Recognizer の場所: class hola.HelloWorld ^ home/karen/workspace/hola/src/hola/HelloWorld.java:23: シンボル symbol が見つかりません: クラス マイクの場所: クラス hola.HelloWorld マイク マイク = (マイク) cm.lookup("microphone"); ^ home/karen/workspace/hola/src/hola/HelloWorld.java:23: シンボル symbol が見つかりません: クラス マイクの場所: クラス hola.HelloWorld マイク マイク = (マイク) cm.lookup("microphone"); ^ home/karen/workspace/hola/src/hola/HelloWorld. java:36: シンボル symbol が見つかりません: クラス 結果の場所: クラス hola.HelloWorld 結果の結果 = 認識.認識(); ^ 12 エラー
私の質問は: プロジェクトを必要とするすべてのパッケージを追加する必要がありますか、それとも jar ファイルとメイン クラスのみを追加する必要がありますか?
お願いします!
これは HelloWord プログラムです。
パッケージほら;
}
open-source - LinuxMint13でCMUPocketSphynxをコンパイルします
Linux Mint 13(Ubuntu 12.04 LTSに基づく)にCMU Sphynxをインストールしましたが、次の例を見つけることができません。
最も簡単な方法でどのように機能するかをテストするにはどうすればよいですか?コマンドラインから起動して、.wavファイルを認識したい。ドキュメントを読みましたが、c ++またはpythonの例があり、pocketsphynx_continiousの例はありません。
Mintで/dev/ dsp deviseはどこで入手できますか?alsaとpulseaudioのすべての開発ライブラリをインストールしました-/dev/dspはまったくありません。
何か助けはありますか?
java - Pythontranscriber.py の実行中にエラーが発生しました
pythontranscriber.py を実行しようとすると、次のエラーで失敗します。
私のスクリプト PythonTranscriber.py:
Jython は既にインストールされています。
私を助けてください!