0

話されている生の文字を私に与えるために Web 音声 API を取得しようとしています。APIから私はこれを見つけました:

SpeechRecognitionAlternative: トランスクリプト属性 トランスクリプト文字列は、ユーザーが話した生の単語を表します。継続的な認識のために、連続した SpeechRecognitionResults の連結がセッションの適切なトランスクリプトを生成するように、必要に応じて先頭または末尾の空白を含める必要があります。

私はそれを使用する方法がわかりませんが。

私が必要とするのは、ユーザーが特定の音を出しているかどうかを検出することです。医者が喉をチェックするときに発するのと同じ音 - 「AHHHHHHHHH」と言う

Web 音声認識の問題点は、実際にはそうではないのに、その音を有効な単語として認識しないことです。そのため、ユーザーが音を出している間に生の文字を拾う必要があります。

これは可能ですか?

ありがとう

4

0 に答える 0