1

Node Red を使用して、Watson ツールセットのさまざまな部分と連携するように開発した一連のかなり堅牢なワークフローがあります。Twilio 経由で音声経由の電話インターフェイスを作成したいのですが、ライブ オーディオ フィードにアクセスするために何をする必要があるかを正確に理解するのに苦労しています。

Node-Red を介して、Watson STT が必要とするもの:

Speech To Text は、人間の声を書き言葉に変換します。このサービスは機械知能を使用して、文法と言語構造に関する情報を音声信号の構成に関する知識と組み合わせて、より正確な文字起こしを生成します。

分析するオーディオ ファイルは、msg.payload で渡す必要があります。

サポートされている msg.payload タイプ:。

文字列 URL to audio Buffer Raw Audio Bytes オーディオは、WAV、FLAC、または OGG でエンコードされたファイルである必要があります。

問題は次のとおりです。プログラム可能な音声の API を精査しましたが、パイプできるオーディオ ストリーム (URL またはオーディオ バイトを介して参照) を作成するために開始する API 呼び出しを見つけることに成功していないようです。ワトソンSTTに。

私よりも Twilio ツールセットの経験が豊富で、答えがある人はいますか?

4

0 に答える 0