「アップ」、「ダウン」、「クローズ」、「オープン」など、非常に限定されたセットから音声コマンドを認識することを要求するソフトウェア契約を要求しています。
本格的な音声認識は必要ないようです。つまり、wave からテキストへの変換を行う必要はありません。私がグーグルできる特定の用語はありますか?
私は、自分でそのようなものをコーディングできるほど、主題について十分に知りません。これに取り組みたいのであれば、この副次的な問題に対してかなり成熟したライブラリ、できればオープンソースが必要です。
ターゲット プラットフォームは、Linux を実行するある種の産業用 PC で、アプリケーションには C または Python を使用します。