問題タブ [pocketsphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
voice-recognition - CMU Sphinx: 既存の語彙に加えてキーワードを追加するには?
CMU Sphinx には、豊富な英単語の語彙が付属しています。それは問題ありませんが、コマンドとして使用する特定の単語を強調したいと思います。これらの単語のいくつかは英単語ではありません。Sphinx が私の特別なコマンド キーワードと残りの英語辞書の単語の両方を理解できるようにするにはどうすればよいですか? 特別なコマンド キーワードが残りの英語の語彙よりも優先されるようにするにはどうすればよいですか?
sphinx を使用して、この目的で使用しようとした呼び出しがあります。
ただし、この方法で追加したすべての単語は、他の単語よりも頻繁に認識されないようです。
python-2.7 - ポケットフィンクス Python のインストール時に Swig が見つからない
書記素を音素に変換したいと思います。そして、それを行うためにポケットフィンクスをインストールしたいと思います。その依存関係の 1 つが swig であるため、ダウンロードしてディレクトリに配置し、環境パス変数に移動して、swig.exe につながるパスを追加します。コマンドを実行して「swig --help」と入力すると、機能しているようです。
しかし、「pip install pocketphinx」に行くと、「エラー:コマンド「swig.exeに失敗しました:そのようなファイルまたはディレクトリはありません」と表示されます。
android - シンハラ語アクセントのスフィンクス ポケット アンドロイド (英語)
シンハラ語のアクセント (英語) 用に Sphinx ポケット android を使用して音声認識アプリケーションを開発しようとしています。でも手続きがわからない。誰かが私を助けることができますか?
linux - Pocket sphnix は単語を認識しません
CMU SphinxBase (sphinxbase-5prealpha.tar.gz) と Pocket Sphinx (pocketsphinx-5prealpha.tar.gz) をダウンロードし、必要なすべてのパッケージ (sudo apt-get libtool bison python-dev autotools swig) をインストールし、すべての手順を実行しました ( http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx )。
RPI で実行した> pocketphinx_continuous -inmic yes Google API V2 で適切に動作する USB Logitech ウェブカメラがあります。
私が知っているすべての英単語と、ポケットフィンクス・コンティニュアスを話しました。以下のようなメッセージが表示されました。何らかの認識が得られることを望んでおり、改善を開始しますが、認識がゼロの場合、改善方法がわかりません。
python - Python を使用して、Raspberry Pi 2 で Pocketsphinx からの出力を表示する GUI をセットアップする必要があります。
Raspberry Pi で Pocketsphinx の出力を表示するだけの GUI をセットアップする必要があります。Pocketsphinx をインストールしてコマンド ラインから実行できますが、GUI の設定方法がよくわかりません。私は Python 2.7 を使用していますが、オンラインで他の人が Python 2.7 をインポートしようとしているのを見たことがありますか? これを理解するのを手伝ってください。ありがとう、
cmusphinx - ポケットフィンクスから声の振幅を取得する方法
私はポケットフィンクスを使用して、誰かが話すときに Android アプリケーションの単語を認識しています。ポケットフィンクスが記録する声の最大振幅を返す機能を実装したいと考えています。私が単語を話す場合、代わりにサウンドレベルを取得する必要があります(単語が認識されるか、デコーダからではないかのいずれか)。私がやったこと:ポケットフィンクスのコードを調べます->ソースファイルで現在コメントされているSpeechRecognizer:
この最大値はバッファから計算されているようです。完全な記録からこれを計算するにはどうすればよいですか。誰かが私にヒントを与えることができますか?
gstreamer - gi._glib.GError:livedemo の実行時に要素「pocketsphinx」エラーがありません
ubuntu 14.04を使用しています
マイクから音声をテキストに変換する Python プログラムを取得しようとしています。このために、sphinxbase と pocketphinx をインストールしました。pocketsphinx_continuous
動作します。
次に、livedemo.py を実行しました。pocketsphinx/src/gst-plugin
これは、次のエラーです。
cmusphinx wikiに従って新しいパスをエクスポートしたことがわかりました。しかし、/usr/local/lib/gstreamer-1.0
存在しません。次に何をすべきですか?
の出力gst-inspect-1.0 pocketsphinx
の出力gst-inspect pocketsphinx
更新:
github から新しいコピーをダウンロードしてインストールしましたが、変更はありません。
sphinxbase ビルド