18

私はようやくポケットスフィンクス (pocketsphinx_continuous) をビルドして実行することができました。私が直面している問題は、精度を向上させる方法です。私が理解していることから、辞書ファイル(-dict test.dic)を指定できます。そこで、デフォルトの辞書ファイルを使用して、同じ単語の発音をいくつか追加しました。次に例を示します。

pencil P EH N S AH L
pencil(2) P EH N S IH L

spaghetti S P AH G EH T IY
spaghetti(2) S P UH G EH T IY

それでも、ポケットフィンクスはどちらの単語もまったく認識しません。同様に指定できるjsgfファイルがあることは知っていますが、それはフレーズと文法のようです。鉛筆やスパゲッティなどの一般的な単語をポケットフィンクスに認識させるにはどうすればよいですか?

ありがとう

-マイク

4

6 に答える 6

10

このようなものでは、確信が持てませんが、次の提案をすることができます。

  1. おそらく、言語モデルは「スパゲッティ」と「鉛筆」の確率が低いのかもしれません。あなたが提案したように、JSGFを使用して、N-gramモデルを使用しない場合、認識のためにどのように機能するかをテストできますが、代わりに単純な文法を実行します(スパゲッティと鉛筆を含む20語のように与えます)。このようにして、これらの単語を認識しにくくするのはおそらく言語モデルであるかどうかを確認でき、すべての単語が等しい確率であると見なすことができれば問題ありません。

  2. おそらく、代替の辞書エントリを使用しても、これらの単語の発音が不十分な場合があります。A.他の人の声をテストするか、B。音響モデルを自分の声に適合させる(http://cmusphinx.sourceforge.net/wiki/tutorialamを参照)

  3. また、それが失敗しているとき、それはそれらを何として認識していますか?可能であれば、誤認識した単語を辞書から削除します。

繰り返しになりますが、全体的な精度については、文法の制限、音響モデルの適応、そしておそらくより高品質の録音入力の取得という3つのことが本当に役立ちます。

于 2011-05-18T04:10:43.030 に答える
7

精度を向上させるために、音響モデルを自分の声に適応させてみることをお勧めします。 http://cmusphinx.sourceforge.net/wiki/tutorialadapt

新しい単語を追加する方法については、http: //ghatage.com/tech/2012/12/13/Make-Pocketsphinx-recognize-new-words/をご覧ください。

于 2012-12-25T07:39:30.227 に答える
3

単語の後、発音の開始前に必ずタブ (スペースではなく) を入れてください。

于 2012-12-15T01:58:04.543 に答える
2

Pocketsphinx に問題がある可能性があります。私も Pocketsphinx で良い結果を得られませんでした。しかし、Sphinx4 では非常に高い精度が得られました (ノイズ キャンセリング マイクを備えた米国のスピーカーの場合)。そのため、同じオーディオ録音を使用して 2 つの比較を行いました。pocketphinx では、WSJ オーディオ モデルと小さな語彙言語モデルおよび辞書 (CMU ケンブリッジ言語モデリング ツールキットを使用してオンラインで作成) を含む pocketphinx_batch を使用しました。Sphinx4 については、Sphinx4 ライブラリを使用して小さな Java プログラムを作成しました。その結果、Sphinx4 の方がはるかに正確でした。詳細はすべてhttp://www.jaivox.com/pocketsphinx.htmlにあります。

于 2013-01-08T02:12:54.693 に答える
0

これは CMUSphinx の Web サイトにあります。

「IPA や SAMPA など、電話を表すさまざまな電話セットがあります。CMUSphinx では、よく知られている電話セットを使用する必要はまだありません。さらに、特別な記号のない文字のみの電話名を使用することを好みます。この要件により、一部の処理アルゴリズムが簡素化されます。たとえば、OS ファイル名の要件に違反することなく、ファイル名の一部として電話名を含むファイルを作成できます。

辞書には、関心のあるすべての単語が含まれている必要があります。そうでない場合、認識エンジンはそれらを認識できません。ただし、単語を辞書に載せるだけでは十分ではありません。認識エンジンは、辞書と言語モデルの両方で単語を探します。言語モデルがなければ、単語が辞書に存在していても認識されません。" https://cmusphinx.github.io/wiki/tutorialdict/

于 2019-07-04T21:35:29.997 に答える