問題タブ [pocketsphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - Android ディクテーション アプリの PocketSphinx
Keith Vertanen の言語モデルの 1 つと組み合わせて、Android で PocketSphinx を使用して「ディクテーション」機能を実装しようとしています。サンプルを次のように変更しました。
lm_csr_5k_nvp_2gram.arpa
Keith Vertanen のサイトの 5K NVP 2-gram ダウンロードからの場所です 。
次のエラーが表示されます。
台詞
lm_csr_5k_nvp_2gram.arpa
ファイルが正しくフォーマットされていないか何かだと思います。ファイルは次のようになります。
これは、少なくともサンプル ファイルのように見えます。
私の他の唯一の考えは、おそらく拡張子が間違っているということでした。
言語モデルは、テキスト ARPA 形式、バイナリ形式 BIN、バイナリ DMP 形式の 3 つの異なる形式で保存およびロードできます。ARPA フォーマットはより多くのスペースを必要としますが、編集することは可能です。ARPA ファイルの拡張子は .lm です。バイナリ形式は、スペースが大幅に少なくて済み、読み込みが高速です。バイナリ ファイルの拡張子は .lm.bin です。フォーマット間の変換も可能です。DMP 形式は廃止され、推奨されません。
lm_csr_5k_nvp_2gram.lm
これにより、ファイルの名前を の代わりに付ける必要があるように聞こえますlm_csr_5k_nvp_2gram.arpa
。ただし、例外を変更することなく、ファイルの名前を変更しようとしました。
これを行う正しい方法は何ですか?
python - Pythonでgstreamer-1.0でポケットフィンクス(5prealpha)を使用するには?
ネットワーク経由でオーディオ ストリームを受信し、それを pocketpinx 経由でフィードして音声をテキストに変換し、pokesphinx の出力に応じていくつかのコマンドを実行する小さな Python スクリプトを作成しようとしています。
Ubuntu 15.10 vm に sphinxbase と pocketphinx (5prealpha) をインストールしましたが、Python でオーディオ ファイルの例 (pokesphinx インストールの一部) の内容を適切に処理できます。そのため、sphinx のインストールが適切に機能していると確信しています。残念ながら、テスト用の Python スクリプトは連続したオーディオを処理できず、ネイティブの pocketphinx API を使用します。cmusphinx Web サイトによると、継続的な翻訳には gstreamer を使用する必要があります。残念ながら、Python で gstreamer を使用して pocketphinx を使用する方法に関する情報はかなり限られています。見つけた例に基づいて、次のスクリプトをつなぎ合わせました。
送信側は次のようになります。
これは、ネットワークから udp ストリームを受信し、それを pocketphinx にフィードし、出力を端末に出力する必要があります。「キューを置き換えると!ポケットフィンクス!「wavenc ! によるフェイクシンク」の部分 filesink '、正しい内容の有効なオーディオ ファイルを取得したので、ネットワーク送信部分が正しく機能していることを確認しました。(テスト マシンにオーディオがないため、ローカル オーディオ ソースでテストすることはできません)。
スクリプトを開始すると、pokespinx の設定が通り過ぎるのが見えますが、その後、スクリプトは何もしていないように見えます。GST_DEBUG=*:4 でスクリプトを開始すると、次の出力が表示されます。
グーグルで見つけた情報と例に基づいて、何がうまくいかないのかわかりません。
どんな助けでも大歓迎です。
ニコ
python - gstreamer を使用して、ポケットフィンクスで構成オプションを設定する方法
おそらく非常にばかげた質問ですが、どこにも解決策が見つかりません。「gst-inspect-1.0 pocketphinx」を実行すると、次のような結果が得られます。
「要素のプロパティ」の値を設定する方法は知っていますが、他の構成オプションの値を設定するにはどうすればよいですか? たとえば、「キーフレーズ」の値を設定したいのですが、次のようにします
また
戻り値
ios - iOS で OpenEars を使用すると、バックグラウンド ノイズによる認識の低下
アプリでOpenEarsを使用して、単語や文章の認識を実行しています。オフライン音声認識の基本チュートリアルに従い、Swift に移植しました。設定手順はこちら
この認識は、静かな部屋で単語と文全体の両方でうまく機能します (ヒット率は 90% だと思います)。しかし、バックグラウンドノイズが少ない静かなパブで試してみると、アプリは単語だけでも認識に深刻な問題がありました。バックグラウンド ノイズがある場合に音声認識を改善する方法はありますか?
python - Python3、Lubuntu 15.10 に PocketSphinx をインストールする
PocketSphinx (python-pocketsphinx、pokesphinx-hmm-wsj1、pokesphinx-lm-wsj) をインストールしましたが、Python3 コードを実行して音声ファイルの音声を認識しようとすると、このエラーが発生します。
物事を複雑にするためにPython 2.7、Python 3.5、およびAnacondaの両方をインストールしましたが、エラーはこれが原因であると思いますか?
以下の行をに追加しました~/.bachrc
。
python3.5と2.7のどちらを入れるか迷ったのですが、3.5だとエラーが出ました[...] ImportError: No module named '_sysconfigdata_m'
。また、anaconda へのパスを設定するために自動的に追加された行を削除しました。このプロジェクトには Anaconda パッケージは必要ありません。
これが役立つ場合のコードも次のとおりです。
エラーを修正し、うまくいけば、さまざまな Python バージョンの混乱を整理してくれたことに非常に感謝しています...