0

以下の Node.js スクリプト スニペットを使用しています。

'use strict';
var google_speech = require('google-speech');
google_speech.ASR({
    debug: true,
    lang: 'en_US',
    developer_key: '<Google API Key>',
    file: '<voice file name with path>',
  }, function(err, httpResponse, xml){   
    if(err){
        console.log(err);
      }else{
        console.log(httpResponse.statusCode, xml)
      }
    }
);

一部のオーディオ ファイルから出力されますが、すべてではありません。たとえば、あるflacファイルは出力を提供していますが、別のflacファイルは提供していません。

この API が出力を提供するために必要な特定の種類のファイルはありますか。はいの場合、ファイルの具体的なタイプ/形式を教えてください。

4

1 に答える 1

0

この google-speech Node ライブラリを使用している場合、ソース コードでcontent-typeヘッダーがaudio/l16; rate=16000 ここにハードコーディングされているようです。

これは、最初のパラメーターのオプションとしてオーバーライドできるようです。たとえば、44.1khz の flac ファイルを使用している場合、次のように動作する可能性があります。

'use strict';
var google_speech = require('google-speech');
google_speech.ASR({
    debug: true,
    lang: 'en_US',
    developer_key: '<Google API Key>',
    file: '<voice file name with path>',
    'content-type': 'audio/x-flac; rate=44100' // ← override it here
  }, function(err, httpResponse, xml){   
    if(err){
        console.log(err);
      }else{
        console.log(httpResponse.statusCode, xml)
      }
    }
);

そうは言っても(これはあなたが尋ねたものではありませんでした)、Googleが最近公式のCloud Speech APIを更新したようです。これも役立つかもしれません。nodejs のチュートリアルがここにあり、サポートされているファイル形式に関するより広範な詳細がここにあります。

于 2016-07-22T20:46:23.260 に答える