iphone - iPhoneで中国語の音声認識を行う方法

Question

OpenEarsは中国語の音声認識を行うことができますか？ここを参照してください：http ：//www.politepix.com/openears

score 6 · Accepted Answer

私はOpenEarsの開発者です。OpenEarsは、箱から出してすぐに英語の音声認識のみを行います。OpenEarsが使用するPocketsphinxディストリビューションにはマンダリン音響モデルがあるため、互換性のある言語モデルと音声辞書を作成する独自の方法があり、自主的な調査とテストを行うために。音響モデルはtdt_sc_8kと呼ばれます。あなたはhub4wsj_sc_8kと呼ばれる指示のフォルダーの代わりにそれを使うでしょう、しかしそれを動かすためにあなたがしなければならないことがもっとあります。

これを試してみたい場合は、CMUスピーチサイトでSphinxプロジェクトのドキュメントを読んで、音響モデル、言語モデル、音声辞書の関係を明確に理解し、その方法を理解することをお勧めします。互換性のある言語モデルを作成します。このページの音声辞書は、おそらく音響モデルと互換性があるため、iPhoneサイズの小さい音声辞書とそれに続く言語モデルを作成できるマスター辞書として開始できる場合があります。そのページの言語モデルは、OpenEarsには大きすぎます。テストのために、私はおそらく約100ワードのコマンドアンドコントロールモデルを作成します。Sphinxナレッジベースツールを使用できるはずです音声辞書を作成した単語のコーパスから言語モデルを作成します。

次のステップは、音響モデル、言語モデル、音声辞書が既知であるかどうかを確認することです。たとえば、Linuxなどの従来のPocketsphinxインストールで機能します。それで良い結果が得られたら、OpenEarsフォーラムにアクセスして、OpenEarsでの動作を支援しようと思います（その音響モデルはテストの一部ではなかったため、保証はありませんが、私もできます」それが機能しない特定の理由を考えてください）。OpenEarsのLanguageModelGeneratorクラスは、間違いなく英語でのみ機能します。プロジェクトの配布を計画している場合は、音響モデルがAppStoreアプリでの使用を妨げない方法でライセンスされていることを確認する必要があります。

幸運を！

編集：これを更新して、Mandarin音響モデルがOpenEarsExtrasの一部になったことを知らせ、LanguageModelGeneratorが更新されたため、任意のマスター音素辞書を指定できるようになりました。正しいフォーマット（つまり、単語、タブ、音素、改行、アルファベット順）。これにより、すでに音響モデルがある場合は、英語以外の言語で動的言語モデラーを使用するのがはるかに簡単になります。

動作するはずの方法は、デフォルトの英語のルックアップ辞書であるcmu07a.dicに類似した、必要な言語のルックアップ辞書があり、LanguageModelGeneratorが残りを処理することです。したがって、それに関する私のステートメントには、複数の手順と調査が必要です。発音を検索できる音声辞書がある場合は、必ずしもそうなるとは限りません。これが実際にどのように機能するかについてのフィードバックは、 OpenEarsフォーラムで非常に高く評価されます（ここでStack Overflowに関するフィードバックやバグレポートを提供しないでください）。

iphone - iPhoneで中国語の音声認識を行う方法

1 に答える 1

Related

Reference