専門家の助けがあれば幸いです。
ユーザーが話すのをやめたときにイベントをトリガーしようとしています。私のアプローチは、単一の入力オーディオ ボリューム レベルの整数をトレースし、それを経時的に測定することです。aurioTouch and speakHere の例を調べました。最初は、いっぱいになるたびに解析される FFT バッファを利用します - そこからスピーチの音量を決定する方法がわかりませんでした。2 つ目は、音声分析を行いません。
方法を知っていますか?mic-incoming-sound-level 隠し変数はありますか?