問題タブ [microsoft-speech-platform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - コルタナを使用して音声をテキストに変換し、そのテキストをテキスト ファイルに保存する方法は?
コルタナを組み込んだアプリケーションがあります。Cortana が継続的に認識し、その音声をテキストに変換するような方法を実行したいと考えています。また、そのテキストをテキスト ファイルに保存します。実際のコーディングはしたくありませんが、これを行うための完璧なフローが必要です。私のプロジェクトで私を助けるフローチャートまたはいくつかのリンクを提供する人はいますか?
windows-10 - Microsoft 音声認識のデフォルトと API
Windows 10 で Microsoft Speech Recognition を使用して、トレーニング演習を行い、テキストをワードパッドに口述して修正し、辞書に単語を追加するなどを行ってきました。このソフトウェアを使用して .wav ファイルを転写したいと考えています。Windows Speech Recognition API を使用してこれを行うことができるようですが、これには独自の文法ファイルを作成してロードする必要があるようです。これは、基本的に、同じ構成要素を使用するが別の新しい音声認識エンジンを作成することを示唆しています。スタートメニューの「音声認識の開始」をクリックすると実行されるプログラムから。特に、トレーニングや構成の違いにより、パフォーマンスが異なります。
私はこれで間違っていますか?そうでない場合、デフォルトの音声認識エンジンが使用するすべてのデータを取得して、その動作を正確に再現できる方法はありますか? .wav ファイルを書き起こすために、独自の文法ファイルと個別のトレーニング履歴などを使用して個別の音声認識エンジンを作成する必要がある場合は、それで十分ですが、ここで何が起こっているのかをよりよく理解したいと思います.
c# - 事前定義された文法を使用しない C# 音声認識
C# アプリケーションで音声認識を使用しようとしていますが、この方法では、出力でフレーズのみを予測しました。
Google Speech Recognition API の作業と同じ方法で出力を取得し、音声を認識し、存在しない単語を出力して出力することはできますか?
speech-recognition - C# WinForm アプリの無料音声認識
Google Speech Recognitionとして機能し、まったく新しい単語を認識してテキストに変換できる、C#Windows Form Application実行可能ファイルの無料の音声認識を見つけようとしています。
System.Speech.Recognition を使用しようとしました。さまざまな方法がありますが、事前に記録されたコマンドには適しています。たとえば、Python を使用した Google 音声認識で動作するような結果は得られません。これは、少なくとも 95% 正しい結果であり、それは良いことです。しかし、どうやら私がキーを持っていない場合、無料で利用できず、実行可能ファイルで使用することはできません。
だから私はMicrosoft Cognitive ServicesのBing Speech APIを試してみたいのですが、それをコーディングする方法の例、いくつかの基本的な例を見つけることができません。誰かがこのツールを扱っている場合は、私が理解するのを手伝ってもらえますか