“pocketsphinx”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

1237 参照

android - Android ディクテーションアプリの PocketSphinx

Keith Vertanen の言語モデルの 1 つと組み合わせて、Android で PocketSphinx を使用して「ディクテーション」機能を実装しようとしています。サンプルを次のように変更しました。

lm_csr_5k_nvp_2gram.arpaKeith Vertanen のサイトの 5K NVP 2-gram ダウンロードからの場所です。

次のエラーが表示されます。

台詞

lm_csr_5k_nvp_2gram.arpaファイルが正しくフォーマットされていないか何かだと思います。ファイルは次のようになります。

これは、少なくともサンプルファイルのように見えます。

私の他の唯一の考えは、おそらく拡張子が間違っているということでした。

言語モデルは、テキスト ARPA 形式、バイナリ形式 BIN、バイナリ DMP 形式の 3 つの異なる形式で保存およびロードできます。ARPA フォーマットはより多くのスペースを必要としますが、編集することは可能です。ARPA ファイルの拡張子は .lm です。バイナリ形式は、スペースが大幅に少なくて済み、読み込みが高速です。バイナリファイルの拡張子は .lm.bin です。フォーマット間の変換も可能です。DMP 形式は廃止され、推奨されません。

lm_csr_5k_nvp_2gram.lmこれにより、ファイルの名前をの代わりに付ける必要があるように聞こえますlm_csr_5k_nvp_2gram.arpa。ただし、例外を変更することなく、ファイルの名前を変更しようとしました。

これを行う正しい方法は何ですか？

2016-02-01T05:08:58.297

0 投票する

2 に答える

1104 参照

python - Pythonでgstreamer-1.0でポケットフィンクス(5prealpha)を使用するには?

ネットワーク経由でオーディオストリームを受信し、それを pocketpinx 経由でフィードして音声をテキストに変換し、pokesphinx の出力に応じていくつかのコマンドを実行する小さな Python スクリプトを作成しようとしています。

Ubuntu 15.10 vm に sphinxbase と pocketphinx (5prealpha) をインストールしましたが、Python でオーディオファイルの例 (pokesphinx インストールの一部) の内容を適切に処理できます。そのため、sphinx のインストールが適切に機能していると確信しています。残念ながら、テスト用の Python スクリプトは連続したオーディオを処理できず、ネイティブの pocketphinx API を使用します。cmusphinx Web サイトによると、継続的な翻訳には gstreamer を使用する必要があります。残念ながら、Python で gstreamer を使用して pocketphinx を使用する方法に関する情報はかなり限られています。見つけた例に基づいて、次のスクリプトをつなぎ合わせました。

送信側は次のようになります。

これは、ネットワークから udp ストリームを受信し、それを pocketphinx にフィードし、出力を端末に出力する必要があります。「キューを置き換えると！ポケットフィンクス！「wavenc ! によるフェイクシンク」の部分 filesink '、正しい内容の有効なオーディオファイルを取得したので、ネットワーク送信部分が正しく機能していることを確認しました。(テストマシンにオーディオがないため、ローカルオーディオソースでテストすることはできません)。

スクリプトを開始すると、pokespinx の設定が通り過ぎるのが見えますが、その後、スクリプトは何もしていないように見えます。GST_DEBUG=*:4 でスクリプトを開始すると、次の出力が表示されます。

グーグルで見つけた情報と例に基づいて、何がうまくいかないのかわかりません。

どんな助けでも大歓迎です。

ニコ

python audio pocketsphinx python-gstreamer

2016-02-05T20:31:35.890

0 投票する

1 に答える

228 参照

python - gstreamer を使用して、ポケットフィンクスで構成オプションを設定する方法

おそらく非常にばかげた質問ですが、どこにも解決策が見つかりません。「gst-inspect-1.0 pocketphinx」を実行すると、次のような結果が得られます。

「要素のプロパティ」の値を設定する方法は知っていますが、他の構成オプションの値を設定するにはどうすればよいですか? たとえば、「キーフレーズ」の値を設定したいのですが、次のようにします

また

戻り値

python pocketsphinx python-gstreamer

2016-02-17T20:38:32.503

0 投票する

2 に答える

426 参照

ios - iOS で OpenEars を使用すると、バックグラウンドノイズによる認識の低下

アプリでOpenEarsを使用して、単語や文章の認識を実行しています。オフライン音声認識の基本チュートリアルに従い、Swift に移植しました。設定手順はこちら

この認識は、静かな部屋で単語と文全体の両方でうまく機能します (ヒット率は 90% だと思います)。しかし、バックグラウンドノイズが少ない静かなパブで試してみると、アプリは単語だけでも認識に深刻な問題がありました。バックグラウンドノイズがある場合に音声認識を改善する方法はありますか?

ios speech-recognition noise-reduction pocketsphinx openears

2016-02-21T22:59:27.283

0 投票する

0 に答える

750 参照

python - Python3、Lubuntu 15.10 に PocketSphinx をインストールする

PocketSphinx (python-pocketsphinx、pokesphinx-hmm-wsj1、pokesphinx-lm-wsj) をインストールしましたが、Python3 コードを実行して音声ファイルの音声を認識しようとすると、このエラーが発生します。

物事を複雑にするためにPython 2.7、Python 3.5、およびAnacondaの両方をインストールしましたが、エラーはこれが原因であると思いますか?

以下の行をに追加しました~/.bachrc。

python3.5と2.7のどちらを入れるか迷ったのですが、3.5だとエラーが出ました[...] ImportError: No module named '_sysconfigdata_m'。また、anaconda へのパスを設定するために自動的に追加された行を削除しました。このプロジェクトには Anaconda パッケージは必要ありません。

これが役立つ場合のコードも次のとおりです。

エラーを修正し、うまくいけば、さまざまな Python バージョンの混乱を整理してくれたことに非常に感謝しています...

python python-2.7 anaconda python-3.5 pocketsphinx

2016-03-02T15:47:27.960

問題タブ [pocketsphinx]

android - Android ディクテーション アプリの PocketSphinx

python - Pythonでgstreamer-1.0でポケットフィンクス(5prealpha)を使用するには?

python - gstreamer を使用して、ポケットフィンクスで構成オプションを設定する方法

ios - iOS で OpenEars を使用すると、バックグラウンド ノイズによる認識の低下

python - Python3、Lubuntu 15.10 に PocketSphinx をインストールする

Reference

android - Android ディクテーションアプリの PocketSphinx

ios - iOS で OpenEars を使用すると、バックグラウンドノイズによる認識の低下