1

ユーザーからマイクを介して音声を取り込み、発言内容をテキストに変換してさらに操作するプログラムを作成しようとしています。

私はグーグルがそのようなものを持っていることを知っています、しかしそれはAndroid開発者のためであり、私はクローム拡張のようなものを作ろうとしています(クローム拡張は私が想像したものですが、私は代替案を受け入れています)。

Mac OSX NSSpeechRecognizerを見てきましたが、事前に限定された文法を指定する必要があるため、より包括的なものが必要です。

ユーザーがマイクに向かって何を言うかを予測したり、予測したりすることはできません(ただし、英語であると想定できます)。

4

1 に答える 1

3

Googleには非公式のAPIがあり、この投稿で説明されているように使用できます:http: //mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

Chrome拡張機能を作成している場合は、次のようなタグを使用できる可能性があります。

<input type="text" x-webkit-speech />

これはマイクボタンを追加し、Googleのクラウド音声認識を使用してテキストボックスにユーザーの発言を入力します。

于 2011-10-21T14:32:36.103 に答える