問題タブ [pocketsphinx-android]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cmusphinx - 言語モデル/セットに含まれていません
私はPocketSphinxを使用して ASR を開発しており、このページのすべての手順に従いました。実行するpocketsphinx_continous
と、次のエラーが表示されます。
ただし、私の言語モデルには と/sタグが含まれています。
私の言語モデルは次のとおりです。
これを作成したコーパス ファイルは次のとおりです。
この問題を解決するためのご支援をお待ちしております。
cmusphinx - 音響モデル 時間数
アラビア文字を認識するモデルを作りたいです。言語モデルと辞書ファイルの作成方法は知っていますが、音響モデルで行き詰まっています。文字ごとにwavファイルを記録しているのですが、研修中、研修は継続しているのに研修時間が少なすぎるとのこと。使用しようとすると、モデルは何も認識しません(nullを与えます)。
wav ファイルをどのように録音すればよいか知りたいのですが、たとえば、 1 つの wav ファイルでAlifのような文字を 100 回繰り返す必要があるのか、それとも同じ文字の複数の wav ファイルを録音するだけなのかを知りたいのです。
あなたの助けは非常に高く評価されています。
java - 文字を認識するときに使用する文法
音声認識を使用して、ユーザーが文字を言うスペリング ゲームを作成したいと考えています。たとえば、ユーザーは「S」「T」「A」「C」「K」と発声します。
これを実現するために PocketSphinx を使用しています。これが私のコードです:
ユーザーが発した文字をどのように認識するのですか?
または、これを達成するために使用できるライブラリはありますか?
cmusphinx - Pocketsphinx setKeywordThreshold() の問題
アプリに Pocketphinx オフライン音声認識を使用することを考えていますが、ドキュメントが明確ではありません。誰かが次の質問に答えてくれれば、本当に助かります。
setKeywordThreshold(1e-5f) メソッドの役割 (用途) は何ですか。このメソッドで許可される最小値と最大値は何ですか。
さまざまな言語をサポートし、このリンクhttp://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/でいくつかの言語の構築済み音響モデルを見つけたいと考えています。しかし、ドキュメンテーションの遅れにより、どのモデルがどの言語に最適なのか理解できません。次の言語に最適な内蔵音響モデルを教えてください -
(a)。オーストラリア英語 (b)。アメリカ英語 (c). イギリス英語 (d)。カナダ英語 (e)。ヨーロッパ英語 (f)。インド英語 (g)。アイルランド英語 (h)。ニュージーランド英語 (i)。南アフリカ英語 (j)。ロシア語 (k)。スペイン語 (l)。フランス語 (m)。オランダ語 (n)。ドイツ人
各言語で 1 から 200 までの数字を認識したいだけです。これを行う最善の方法は何ですか?
1 から 99 までの数字を認識する digits.gram ファイルを作成しましたが、背景の音声も認識します。たとえば、ボール盤のバックグラウンド ボイスが発生すると、バックグラウンド ボイスとして認識します。特定の数字が話された場合にのみ数字を認識するにはどうすればよいでしょうか?
digits.gram ファイル
android - pocketSphinx の新しい .gram ファイル
上記のプロジェクトに取り組んでおり、新しい単語セットを digit.gram ファイルにリストしました。
この認識に関する私の疑問は、 digits.gram を呼び出す数字を言う代わりに、新しい「.gram」ファイルを認識したいということです。
たとえば、数字の代わりに robot と言うと、robot.gram が呼び出されますが、それを可能にする方法は?
pocketsphinx-android - ポケット スフィンクス アンドロイド デモ 4.4
Pocket Sphinx android デモは、LG l39c android 4.1 で正常に動作します。LG l34c Android 4.4 では動作しません
「致命的なシグナル 6 (SIGABRT) 0x00000365 (コード = 0)、スレッド 5046 (cketsphinx.demo)」
また、TTS が onInit を呼び出さないという問題があります (待機は役に立ちません)。
ここでも、両方とも LG l39c android 4.1 で正常に動作します。4.4でこれらの問題を抱えている人はいますか? ありがとう
mfcc - Android の PocketSphinx で MFCC 機能を抽出する方法
最近、Android Studio 用の PocketSphinx Android Demo をダウンロードしました。私のGalaxy S5で動作しましたが、実際にその精度に驚いています. ただし、いくつかの理由で MFCC 機能を抽出するのに苦労しています。
FrontEnd クラスを使用して MFCC 機能を生成する方法についての説明がありますが、これは Sphinx-4 実装用に書かれています。次のような行を含む sphinx プロパティ ファイルを実装する方法と場所:
<"コンポーネント名="mfcFrontEnd" タイプ="edu.cmu.sphinx.frontend.FrontEnd">
これは、PocketSphinx で Sphinx-4 ライブラリを使用するにはどうすればよいかという疑問につながります。