問題タブ [microsoft-speech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - アプリで bing 音声 API を使用するには?
Bing Speech API を使用したことがないので、Bing Speech API について多くの質問があります。
Bing speech API を使用して Android アプリを作成したい場合、Azure で bing speech API をサブスクライブする必要がありますか?
また、LUIS にサインアップする必要がありますか?
そして、「主キー」と「サブスクリプションキー」の違いを知りたいです。
speech-recognition - C# WinForm アプリの無料音声認識
Google Speech Recognitionとして機能し、まったく新しい単語を認識してテキストに変換できる、C#Windows Form Application実行可能ファイルの無料の音声認識を見つけようとしています。
System.Speech.Recognition を使用しようとしました。さまざまな方法がありますが、事前に記録されたコマンドには適しています。たとえば、Python を使用した Google 音声認識で動作するような結果は得られません。これは、少なくとも 95% 正しい結果であり、それは良いことです。しかし、どうやら私がキーを持っていない場合、無料で利用できず、実行可能ファイルで使用することはできません。
だから私はMicrosoft Cognitive ServicesのBing Speech APIを試してみたいのですが、それをコーディングする方法の例、いくつかの基本的な例を見つけることができません。誰かがこのツールを扱っている場合は、私が理解するのを手伝ってもらえますか
c# - Bing Speech API とボット フレームワーク
Bot Framework 内で Bing の音声 API を使用しようとしています (これらのテクノロジの両方に精通しています)。具体的には、サポートされている DataClientWithIntent を使用しようとしています。GitHubでこの例を見ることができましたが、残念ながらこれは DataClient のみを使用しているようで、これが指定されている場所を特定できません。API は次の方法で呼び出されます。
ご覧のとおり、ストリームが渡されますが、残念ながら、これはユーザーが書き込んだ内容を書き戻すだけです。
Luis アプリケーションを使用する目的で既にテスト ボットを開発しましたが、ユーザーが会話または入力して同じ結果を達成できる機能を追加したいと考えています。this other exampleを見つけましたが、これはSkypeフレームワークを介して直接実装しているため、現時点では興味がありません.
アイデア、ドキュメント、または説明をいただければ幸いです。
c# - Microsoft Bing 音声認識の設定に関する問題
Microsoft の Bing Speech Recognition サービス ライブラリを使用しようとしています。次のコマンドは、引数付きの cmd で指定する必要があります。しかし、このコマンドをどの形式で入力すればよいかわかりません。どこにも見つかりませんでした。誰かが私を助けることができますか?既存のオーディオ WAV ファイルを指定する必要がありますか? パスを指定する必要がありますか? 「オーディオロケール」とは?
SpeechClientSample.exe
次の引数で実行します。
Arg[0]
: 入力オーディオの WAV ファイルを指定します。Arg[1]
: オーディオ ロケールを指定します。Arg[2]
: 認識モードを指定します: モードの場合はShort、ShortPhrase
モードの場合はLongですLongDictation
。Arg[3]
: 音声認識サービスにアクセスするためのサブスクリプション キーを指定します。
speech-recognition - Microsoft Speech SDK での単一文字の使用
ちょうど文字を使っていたら、DがBと混同し、多くの文字が他の文字と混同されていたので、正しく機能していなかった文字を単語または名前に置き換えましたが、ご覧のとおり、半分です彼ら。たとえば、「B」と混同せずに「D」と言うことができる解決策があるかどうか疑問に思っていましたか?
angular - Angular で Microsoft Speech API を動作させる
こんにちは、Microsoft Speech API で Angular 5 を動作させる方法を見つけようとしています。javascript に microsoft-speech-browser-sdk を使用しました。
https://github.com/Azure-Samples/SpeechToText-WebSockets-Javascript
SDK import * as SDK from 'microsoft-speech-browser-sdk'; をインポートするだけです。そして、私は例で同じコードを使用しようとしました
しかし、私はこのエラーがあります SDK.Recognizer.CreateRecognizer is not a function 最初の関数を実行するため、skdがインポートされていることを知っています
また、APIリファレンスが見つかりませんAngularでこのコグニティブサービスを利用した人はいますか?