私はこれについてしばらくの間興味があったので、多分ここに投稿することでいくつかの良い答えを得ることができると思いました。
私がこれまでに知っていること:
人間は両耳を使って、「どのように聞こえるか」だけでなく、どこから来ているのかを知ることができます。ピッチは私たちが聞く音であり、人間の声のようなものにはさまざまなピッチが重ねられています(純音ではありません)。
私が知りたいこと:
音がどこから来ているのかを知ることができるプログラムを書くにはどうすればよいですか?理論的な観点からは、2つのマイクが必要です。次に、マイクに着信するサウンドデータを録音し、オーディオデータを[streamA、streamB]のようなタプルに入れることができるようにオーディオデータを保存します。
音の出所である音声に基づいて計算する公式/数学的な方法があるのではないかと思います。また、ストリームデータを取得して学習者をトレーニングし(サンプルオーディオを提供し、オーディオの出所を教えて)、着信オーディオをそのように分類することも可能だと感じています。
これを行うための最良の方法は何ですか/主題についてもっと学ぶことができる良いリソースはありますか?
編集:
例:
front
左(マイク)x ======== x(マイク)右
back x (sound source should return "back" or "right" or "back right")
聞こえる音のほとんどを前後左右に戻せるプログラムを書きたいです。私が理解していることから、「前方」に向けられた2つのマイクを設定するのは簡単なはずです。これに基づいて、サウンドを三角測量し、マイクとの関係でソースがどこにあるかを知る方法を見つけようとしています。