話されている生の文字を私に与えるために Web 音声 API を取得しようとしています。APIから私はこれを見つけました:
SpeechRecognitionAlternative: トランスクリプト属性 トランスクリプト文字列は、ユーザーが話した生の単語を表します。継続的な認識のために、連続した SpeechRecognitionResults の連結がセッションの適切なトランスクリプトを生成するように、必要に応じて先頭または末尾の空白を含める必要があります。
私はそれを使用する方法がわかりませんが。
私が必要とするのは、ユーザーが特定の音を出しているかどうかを検出することです。医者が喉をチェックするときに発するのと同じ音 - 「AHHHHHHHHH」と言う
Web 音声認識の問題点は、実際にはそうではないのに、その音を有効な単語として認識しないことです。そのため、ユーザーが音を出している間に生の文字を拾う必要があります。
これは可能ですか?
ありがとう