speech-recognition - Sphinx を拡張してローカル言語をサポートする

Question

最初は、母国語をサポートするために、音声認識エンジンをゼロから作成することを考えていました (50 ～ 100 語をサポート)。

しかし、いくつかの調査の結果、非常に限定的なサポートでも 1 年半で音声認識エンジンを作成することは不可能であることが明らかになりました。

現在、自分の言語をサポートするためにスフィンクスエンジンを拡張することを考えていました。1.5年でできるのか、それとも最終年度のプロジェクトとしてはやり過ぎなのか。

この件に関して、あなたの経験談を心待ちにしています。

score 2 · Accepted Answer

音声認識にかかる時間は、アプリケーションによって異なります。

必要になるだろう：

項目 10 は最も時間のかかる作業です!!!

回答：はい、3ヶ月で商用利用可能です。

Sphinx は 1 つの可能性です。HTK は、完全なシステムをトレーニングおよびテストするための優れたオープンソースの音声認識システムです。Julius は、HTK で構築された音響モデルと言語モデルを使用するオープンソースの音声認識エンジン (エンジン) です。

ルイス・ウベル

ASR ラボ - www.asrlabs.com.br

score 2 · Accepted Answer

はい、もちろん可能です。卒業論文のために Chatino 用の同様の認識エンジンを作成しました。（チャティーノ語は、メキシコ南部オアハカの先住民族の言語です）。認識エンジンには、Sphinx4 を使用して構築された分離単語認識エンジンと連続音声認識エンジンの両方が含まれています。

2 に答える 2