私の仕事は、人間からの直接話法ではなく、音声ファイルをテキストに変換することです。
たとえば、wavファイルに「Hellothere」ストアがある場合、それをテキストに転記し、画面に「Hellothere」文字列を表示します。
優先されるが優先される言語コードはC#です。
私の仕事は、人間からの直接話法ではなく、音声ファイルをテキストに変換することです。
たとえば、wavファイルに「Hellothere」ストアがある場合、それをテキストに転記し、画面に「Hellothere」文字列を表示します。
優先されるが優先される言語コードはC#です。
SAPIは確かにあなたが望むことをすることができます。インプロセスレコグナイザーから始めて、オーディオをファイルストリームとして接続し、ディクテーションモードを設定して、次に進みます。
今、残念なビット。おそらく、ひどく良い結果は得られないでしょう。実際、あなたが非常に幸運でない限り、あなたはおそらく完全なゴミを手に入れるだろうと私は思う。
いくつかの問題があります:
Dragon Naturally Speaking Professionalは文字起こしをサポートしていますが、それでもトレーニングと単一の音声が必要です。(DNSにはボイスレコーダーに適したカスタムオーディオモデルがあると思います。)私はそれを自分で使用したことがないので、あなたの状況でどれだけうまく機能するかわかりません。
さて、あなたが特定のキーワードを探しているなら、他の人々は「オーディオマイニング」を使って成功しています-オーディオストリームで特定のキーワードを探しているレコグナイザーを実行します