0

オウムの叫び声や鳴き声を認識したときに特定のオーディオトラックのオンとオフを切り替えるプログラムを開発する必要があります。ソフトウェアは、特定の範囲の音を認識し、範囲のいくつかのバリエーションを許可する必要があります(オウムは毎回そのスリーチを正確に複製しない可能性が高いため)。

例:鳥の鳴き声、音声なし。鳥は5秒間鳴き声を止め、鳥を称賛するオーディオトラックが再生されます。定期的なおしゃべりは、落胆させないため、完全に無視する必要があります。

辞書が組み込まれた音声認識を備えたJavaライブラリについて聞いたことがありますが、ソフトウェアには、単語やランダムな鳥の音ではなく、特定のオウムが発する特定の音を教える必要があります。さらに、前述したように、スクリーチが録音されたバージョンと100%同一になることはない可能性があるため、サウンドのわずかな変動を考慮する必要があります。

これを実行するための最良の方法は何ですか/どの言語を調べる必要がありますか?

編集:あるいは(そしておそらくこれはより簡単な解決策になるでしょう)、入力の音量に基づいてオーディオを切り替える方法はありますか?それで、オウムがどんな音を出すかは問題ではなく、どれだけ大きいのでしょうか?

4

1 に答える 1

0

この質問は、音声認識と密接に関係しているようです。この投稿を見ることをお勧めします: How to convert human voice into digital format?

于 2011-03-09T03:02:58.893 に答える