1

直接マイク入力の代わりに、事前に録音されたオーディオ ファイルで NSSpeechRecognizer を使用することは可能ですか?

それとも、Objective-C/Cocoa 用の音声からテキストへのフレームワークが他に利用可能ですか?

追加

アプリケーションを実行しているマシンで音声を使用するのではなく、外部デバイス (iPhone など) を使用して、録音されたオーディオ ストリームだけをそのデスクトップ アプリケーションに送信できます。デスクトップの Cocoa アプリは、割り当てられたコマンドを使用して処理し、想定されていることを実行します。

ありがとう。

4

1 に答える 1

2

プログラムで入力を切り替える明白な方法はわかりませんが、「音声認識」セクションの「音声」コンパニオン ガイドの最初の段落は、他の入力を使用できることを暗示しているようです。ただし、これはシステム環境設定で設定することを意図していると思います。そこで選択されたプライマリオーディオ入力デバイスを使用していると思います。

ただし、NSSpeechRecognizer ではなく、無制限の音声認識を探しているのではないかと思います。事前に録音されたオーディオをテキストに変換する (つまり、録音のトランスクリプトを作成する) 場合は、リッスンする「コマンド」の配列を渡す必要があるため、NSSpeechRecognizer では完全にうまくいきません。

理論的には、辞書全体をフィードすることもできますが、通常は明確で明確なコマンドを指定する必要があるため、うまくいかないと思います。(リアルタイムで)分析するものをたくさん与えた場合、そのパフォーマンスは低下すると思います。

最善の策は、サードパーティのオープン ソース ソリューションを検討することです。一般化されたパッケージがいくつかあります (Cocoa/Objective-C 専用のものはありません) が、これは別の疑問を投げかけます。音声認識の 2 つの主要な形式 (「訓練された」はより正確ですが、さまざまな声や録音環境に対する柔軟性が低く、「オープン」は一般的にはるかに正確ではありません)。

達成しようとしていることを正確に述べた方がよいでしょう。

于 2009-11-02T20:34:53.713 に答える