0

「アップ」、「ダウン」、「クローズ」、「オープン」など、非常に限定されたセットから音声コマンドを認識することを要求するソフトウェア契約を要求しています。

本格的な音声認識は必要ないようです。つまり、wave からテキストへの変換を行う必要はありません。私がグーグルできる特定の用語はありますか?

私は、自分でそのようなものをコーディングできるほど、主題について十分に知りません。これに取り組みたいのであれば、この副次的な問題に対してかなり成熟したライブラリ、できればオープンソースが必要です。

ターゲット プラットフォームは、Linux を実行するある種の産業用 PC で、アプリケーションには C または Python を使用します。

4

2 に答える 2

1

これは適切な候補のように見えます: CMU Sphinx

ただし、試していません。

于 2011-03-14T14:46:45.600 に答える
0

pyspeech をチェックアウトできますが、Windows のみだと思います。音声からテキストへの Python の音声処理ライブラリを参照してください。

于 2011-03-14T20:57:59.730 に答える