Mac OS x でマイクを介して音声を受信するシステムを実装したいと考えています。システムを訓練しない限り、任意の音声認識はほとんど不可能であることを知っているので、10 の簡単な文に制限しても構わないと思っています。これらの 10 文のうちどの文が話されているかを高い精度で認識し、テキストを生成して、リモートの MySQL データベースにエントリを追加する必要があります。
これらが私が実装したいシステムのアーキテクチャであるため、このシステムを実装するための最良の方法について概要を説明してくれる人はいますか? これはデモンストレーション用のプロトタイプ アプリケーションにすぎないため、コーディングを最小限に抑えるためのオープン ソース ライブラリのようなアイデアを探しています。基本的に、私は迅速かつ簡単な解決策を探しています。ありがとう!