2

音声を文字に変換するために使用される WebkitSpeechRecognition サービスを試してみました ( https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API )。現状ではまともなおもちゃですが、実際に役立つほど正確ではありません。ただし、一時停止を検出し、ユーザーが何を言ったかについて漠然とした考えを与えるために、少なくともいくつかの単語を正しく取得するのは得意です。

私が便利だと思うのは、生のオーディオもキャプチャできることです。そうすれば、書き起こしたテキストと一緒に表示して、ユーザーが正しく書き起こされなかった文を手動で再生できるようにすることができます。

残念ながら、API のどこにも公開されていません。これを達成する方法はありますか?そうでない場合は、キャプチャなど、これに使用できるハックや CPU ドレインが多すぎない代替ソリューションはありNavigator.getUseMedia()ますか? もしそうなら、一時停止の検出と自分自身を分割するためのロジックを書き直す必要がありますか?

4

0 に答える 0