javascript - Microsoft Cognitive Services の REST Speech Recognition API から長いディクテーション結果を取得するにはどうすればよいですか?

Question

Bing Voice Recognition の REST API から短いディクテーションの回答を得ることができました。私の目標は、15 ～ 30 秒を超えるオーディオファイル (別名ロングディクテーションモード) の応答を取得することです。短い答えを得るために私がすることは次のとおりです(私はHTML uwpアプリを開発しています):

ArrayBufferオーディオファイル (wav) からを生成する
アクセストークンによる認証
次の設定で音声データを REST API に送信します。

var accessToken = [[accessTocken]];
var url = 'https://speech.platform.bing.com/recognize?'; 
var params = {
    'version': '3.0',
    'format': 'json',
    'locale': 'en-US',
    'device.os': 'Windows OS',
    'scenarios': 'smd',
    'appid': 'D4D52672-91D7-4C74-8AD8-42B1D98141A5',
    'requestid': guid(),
    'instanceid': guid()
};
var options = {
    url: url + $.param(params),
    type: "POST",
    headers: {
        'Authorization': 'Bearer ' + accessToken,
        'Content-Type': 'audio/wav; samplerate=16000'
    },
    data: data
};
return WinJS.xhr(options);

だからこれはうまくいく！しかし、長いディクテーションシナリオでこれを行うにはどうすればよいでしょうか。

https://github.com/microsoft/Cognitive-Speech-STT-Javascriptで JavaScript GitHub リポジトリを参照しないでください。これは短いディクテーションでのみ機能し、Edge ブラウザーでは機能しません。

javascript - Microsoft Cognitive Services の REST Speech Recognition API から長いディクテーション結果を取得するにはどうすればよいですか?

1 に答える 1

Related

Reference