0

私は Cued Speech に関するプロジェクトに取り組んでいます (キュード スピーチは、聴覚障害者や難聴者との間で使用される視覚的なコミュニケーション システムです)。これは、伝統的に話されている言語を、口の近くのさまざまな場所 (母音を表す) にある手がかり (子音を表す) と呼ばれる少数の手形を使用して、読み上げの補助として利用できるようにする音素ベースのシステムです。

私はすでに音素認識(pocketsphinx_continuous)、アンドロイドのポケットフィンクスに関するチュートリアルに従っており、機能しています。私は今のところ Android で作業していますが、このプロジェクトの最終的な目標は、Google グラスで動作させることです。最良のケースは、識別された音素に従って正しい手の構成と唇の動きを再現する音声 (リアルタイムに近い) と 3D のアバターをデバイスに書き込むことです。(そのため、単語そのものではなく、音素を扱う必要があります)

http://cmusphinx.sourceforge.net/wiki/phonemerecognitionを読みましたが、フランス語の音素用に独自の「ファイル」を作成して Android で動作させる方法についてかなり混乱しています。

手順は?どのようなファイルを作成すればよいですか?

つまり、音声入力のある Android の音素で pocketphinx_continuous と同じ結果が得られる可能性はありますか?

あなたが私を案内してくれることを願っています!

ギヨーム

4

1 に答える 1

3

最新のポケットフィンクスのデモには、「電話」検索でアクティブ化される音声認識モードが含まれています。詳細については、ソースを参照してください。

https://github.com/cmusphinx/pocketsphinx-android-demo

フランス語で使用するには、フランス語の音響モデルで更新する必要があります。

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/French%20F0%20Broadcast%20News%20Acoustic%20Model/lium_french_f0.tar.gz/download

フランス語の音声言語モデルを使用すると、次のようになります。

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/French%20Language%20Model/fr-phone.lm.dmp/download

このような:

    recognizer = defaultSetup()
            .setAcousticModel(new File(modelsDir, "hmm/french");
            .setBoolean("-allphone_ci", true)
            .getRecognizer();
    // Phonetic search
    File phoneticModel = new File(modelsDir, "phone/fr-phone.lm.dmp");
    recognizer.addAllphoneSearch(PHONE_SEARCH, phoneticModel);

Glass でうまく動作するとは思えませんが、非常に強力なデバイスではないようです。

于 2014-11-30T00:24:54.307 に答える