問題タブ [pocketsphinx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1237 参照

android - Android ディクテーション アプリの PocketSphinx

Keith Vertanen の言語モデルの 1 つと組み合わせて、Android で PocketSphinx を使用して「ディクテーション」機能を実装しようとしています。サンプルを次のように変更しました。

lm_csr_5k_nvp_2gram.arpaKeith Vertanen のサイトの 5K NVP 2-gram ダウンロードからの場所です 。

次のエラーが表示されます。

台詞

lm_csr_5k_nvp_2gram.arpaファイルが正しくフォーマットされていないか何かだと思います。ファイルは次のようになります。

これは、少なくともサンプル ファイルのように見えます

私の他の唯一の考えは、おそらく拡張子が間違っているということでし

言語モデルは、テキスト ARPA 形式、バイナリ形式 BIN、バイナリ DMP 形式の 3 つの異なる形式で保存およびロードできます。ARPA フォーマットはより多くのスペースを必要としますが、編集することは可能です。ARPA ファイルの拡張子は .lm です。バイナリ形式は、スペースが大幅に少なくて済み、読み込みが高速です。バイナリ ファイルの拡張子は .lm.bin です。フォーマット間の変換も可能です。DMP 形式は廃止され、推奨されません。

lm_csr_5k_nvp_2gram.lmこれにより、ファイルの名前を の代わりに付ける必要があるように聞こえますlm_csr_5k_nvp_2gram.arpa。ただし、例外を変更することなく、ファイルの名前を変更しようとしました。

これを行う正しい方法は何ですか?

0 投票する
2 に答える
1104 参照

python - Pythonでgstreamer-1.0でポケットフィンクス(5prealpha)を使用するには?

ネットワーク経由でオーディオ ストリームを受信し、それを pocketpinx 経由でフィードして音声をテキストに変換し、pokesphinx の出力に応じていくつかのコマンドを実行する小さな Python スクリプトを作成しようとしています。

Ubuntu 15.10 vm に sphinxbase と pocketphinx (5prealpha) をインストールしましたが、Python でオーディオ ファイルの例 (pokesphinx インストールの一部) の内容を適切に処理できます。そのため、sphinx のインストールが適切に機能していると確信しています。残念ながら、テスト用の Python スクリプトは連続したオーディオを処理できず、ネイティブの pocketphinx API を使用します。cmusphinx Web サイトによると、継続的な翻訳には gstreamer を使用する必要があります。残念ながら、Python で gstreamer を使用して pocketphinx を使用する方法に関する情報はかなり限られています。見つけた例に基づいて、次のスクリプトをつなぎ合わせました。

送信側は次のようになります。

これは、ネットワークから udp ストリームを受信し、それを pocketphinx にフィードし、出力を端末に出力する必要があります。「キューを置き換えると!ポケットフィンクス!「wavenc ! によるフェイクシンク」の部分 filesink '、正しい内容の有効なオーディオ ファイルを取得したので、ネットワーク送信部分が正しく機能していることを確認しました。(テスト マシンにオーディオがないため、ローカル オーディオ ソースでテストすることはできません)。

スクリプトを開始すると、pokespinx の設定が通り過ぎるのが見えますが、その後、スクリプトは何もしていないように見えます。GST_DEBUG=*:4 でスクリプトを開始すると、次の出力が表示されます。

グーグルで見つけた情報と例に基づいて、何がうまくいかないのかわかりません。

どんな助けでも大歓迎です。

ニコ

0 投票する
1 に答える
228 参照

python - gstreamer を使用して、ポケットフィンクスで構成オプションを設定する方法

おそらく非常にばかげた質問ですが、どこにも解決策が見つかりません。「gst-inspect-1.0 pocketphinx」を実行すると、次のような結果が得られます。

「要素のプロパティ」の値を設定する方法は知っていますが、他の構成オプションの値を設定するにはどうすればよいですか? たとえば、「キーフレーズ」の値を設定したいのですが、次のようにします

また

戻り値

0 投票する
2 に答える
426 参照

ios - iOS で OpenEars を使用すると、バックグラウンド ノイズによる認識の低下

アプリでOpenEarsを使用して、単語や文章の認識を実行しています。オフライン音声認識の基本チュートリアルに従い、Swift に移植しました。設定手順はこちら

この認識は、静かな部屋で単語と文全体の両方でうまく機能します (ヒット率は 90% だと思います)。しかし、バックグラウンドノイズが少ない静かなパブで試してみると、アプリは単語だけでも認識に深刻な問題がありました。バックグラウンド ノイズがある場合に音声認識を改善する方法はありますか?

0 投票する
0 に答える
750 参照

python - Python3、Lubuntu 15.10 に PocketSphinx をインストールする

PocketSphinx (python-pocketsphinx、pokesphinx-hmm-wsj1、pokesphinx-lm-wsj) をインストールしましたが、Python3 コードを実行して音声ファイルの音声を認識しようとすると、このエラーが発生します。

物事を複雑にするためにPython 2.7、Python 3.5、およびAnacondaの両方をインストールしましたが、エラーはこれが原因であると思いますか?

以下の行をに追加しました~/.bachrc

python3.5と2.7のどちらを入れるか迷ったのですが、3.5だとエラーが出ました[...] ImportError: No module named '_sysconfigdata_m'。また、anaconda へのパスを設定するために自動的に追加された行を削除しました。このプロジェクトには Anaconda パッケージは必要ありません。

これが役立つ場合のコードも次のとおりです。

エラーを修正し、うまくいけば、さまざまな Python バージョンの混乱を整理してくれたことに非常に感謝しています...