2

この質問には答えられないかもしれませんが、私はこの問題について助けを求めています。PythonでMicrosoftのSpeechAPIを処理するためのコードスニペットを見つけて、W3Cの「SpeechRecognitionGrammarSpecificationVersion1.0 」について学びました。

私はそれをこれに煮詰めました:

>>> import win32com.client
>>> listener = win32com.client.Dispatch("SAPI.SpSharedRecognizer")
>>> context = listener.CreateRecoContext()
>>> grammar = context.CreateGrammar()
>>> grammar.DictationSetState(0)
>>> grammar.CmdLoadFromFile("C:\\grammar.grxml")
Traceback (most recent call last):
  File "<pyshell#1>", line 1, in <module>
    grammar.CmdLoadFromFile("C:\\grammar.grxml")
  File "C:\Python26\lib\site-packages\win32com\gen_py\C866CA3A-32F7-11D2-9602-00C04F8EE628x0x5x4.py", line 2372, in CmdLoadFromFile
    , LoadOption)
com_error: (-2147352567, 'Exception occurred.', (0, None, None, None, 0, -2147201021), None)

私が発見したことから、上記のエラーコードは「SPERR_NO_DRIVER」に対応しており、「ウェーブドライバーがインストールされていません」と関係があります。

私は今立ち往生しています。このコンテキストで、Waveドライバーが何であるか、どこにあるか、どのようにデバッグするかなどはわかりません。何か考えはありますか?

4

1 に答える 1

0

.wavデータは、最も基本的な種類のサウンドデータです。波形の生のサンプリング、「サウンドの音量」は1秒間に8000〜44000回です。

ウェーブドライバーを使用すると、コンピューターでこの生データをマイクから取得したり、スピーカーに送信したりできます。

コンピュータにサウンドカードがある場合は、すでにこれがインストールされているはずです。サウンドハードウェアのないコンピューターで開発していますか?

編集:ドキュメントをもう少し見てから、エラーを誤って特定したと思います。-2147201021は0x80045003であり、これはSPERR_UNSUPPORTED_FORMATです(http://msdn.microsoft.com/en-us/library/ms717306%28VS.85%29.aspxを参照) 。

ご使用のバージョンのSpeechAPIがgrxmlファイルをサポートしていることを確認しますか?http://msdn.microsoft.com/en-us/library/ee125091%28v=VS.85%29.aspxを見ると、.xmlまたは.cfgのいずれかが必要になる場合があります-拡張子を.grxmlから.xmlに変更してみてください?

于 2010-12-20T03:04:25.290 に答える