1

MS SAPI 5を使用して構築するカスタムディクテーションアプリケーションを調査しています。認識されている内容に基づいて、ディクテーションの文法(トピック)を動的に変更できるようにしたいと思います。たとえば、私のディクテーションアプリケーションが自動車の修理を扱っている場合、エンジンについて話しているスピーカーを検出した場合、キャビンの張りではなく、エンジンの部品名を認識するために最適化されたディクテーショントピックを持ち込みたいと思います。

これが可能かどうか誰か知っていますか?

ありがとう。

-ラジ

4

1 に答える 1

1

あなたの最大のハードルは、どのトピックが議論されているかを特定する「絶対確実」な方法を開発することだと思います. 「エンジンについて話す」というあなた自身の発言を参照すると、単にエンジンを聞いてその単語をキーオフすると、たとえばエンジンという単語を使用して、自動車のエンジンとソフトウェア ゲーム エンジンの両方を表すことはできません。私はいくつかのスピーチシンセサイザーを使用しました。私が使用したものは、特定のコマンドがリッスンを開始するのを待ちます。おそらく、リスニング開始コマンドの組み合わせを使用できます。

ユーザー「コンピューター、聞いてください。」

コンピューター「聞く準備ができました。」

ユーザー「車のエンジン」

COMPUTER「車のエンジンライブラリを読み込んでいます。」

このようなものは、ライブラリを追加する柔軟性を維持しながら、問題に対する合理的なアプローチである可能性があります。このアプローチを利用して、デフォルト ライブラリを実装することもできます。指定された 2 番目のコマンドが認識されたライブラリでない場合、プログラムは既定のライブラリを使用できます。

于 2010-10-01T10:45:28.130 に答える