Javaを使用してオーディオ.wavファイルから人間の音を抽出する必要があるプロジェクトに取り組んでいます。
オーディオ .wav ファイルには、犬、猫、音楽、人間などの 3 ~ 4 種類の音が含まれている場合があります。人間の音を識別し、オーディオ .wav ファイルからその部分を抽出する必要があります。
私はFFT.javaとComplex.javaを使用しています。
ここで、ハード ドライブから audio.wav ファイルを読み取り、これをバイト配列に変換する AudioFileReader クラスを作成しました。次に、上記の FFT.java と Complex.java を使用して FFT.fft(bytesArray) を適用すると、代わりに Complex 配列が返されます。
問題は、返された複合配列から人間の音のバイトパターンを抽出する方法です...これを達成する方法を知っている人はいますか?
編集: 非常に単純な audio.wav ファイルを想定しています。たとえば、猫の音の後に無音、人の音の後に無音、犬の音の後に無音など。