ユーザーからマイクを介して音声を取り込み、発言内容をテキストに変換してさらに操作するプログラムを作成しようとしています。
私はグーグルがそのようなものを持っていることを知っています、しかしそれはAndroid開発者のためであり、私はクローム拡張のようなものを作ろうとしています(クローム拡張は私が想像したものですが、私は代替案を受け入れています)。
Mac OSX NSSpeechRecognizerを見てきましたが、事前に限定された文法を指定する必要があるため、より包括的なものが必要です。
ユーザーがマイクに向かって何を言うかを予測したり、予測したりすることはできません(ただし、英語であると想定できます)。