-2

...

こんにちは、みんな!

私は音声認識に関する日曜大工のデバイスを作ろうとしている学生です。音声認識ほど正確で複雑ではありません。小さなアプリに単純な認識ライブラリを採用して使用したいだけです。

私がやりたいことは、つまり「広範囲」での音声認識です。つまり、「ブーン!ブーン!」という音がする場合です。「よし、これはシボレー コルベット Z06 の特定のエンジン音だ。いいマシンだな」などと認識する必要はありません。(X) ではなく、「車が近づいてくる。うるさくてうるさい」のようなものとして認識します。(O) これで十分です。

または、「カブーン!」という音がする場合。「バン!」、「北大橋で花火大会。今年の冬は?遅れてる人もいるのかな?」と認識しなくてもいいです。(X) しかし、「ファイアー ブーム。私は決してそこに行きません。奇妙です。」(○)これで十分です。... 等々。つまり、匿名ライブラリでサウンドを「分類」し、アプリで提供されるガイドラインの有用な情報として使用したいと考えています。

役立つ情報や参照できる推奨ライブラリはありますか? 素晴らしいアドバイスをお待ちしております。ありがとうございました。

よろしく、

J・パーク

4

1 に答える 1