2

ユーザーの音声コマンドを保存し、アプリケーションの実行中に Android 用のアプリケーションを作成しています。マイク入力からのリアルタイム データと保存されているデータを比較します。これまでのところ、音声を wav ファイルに保存しましたが、それを入力ストリームと比較したいと思います。Android と互換性があるため、この API を使用して FFT を適用しました。

http://code.google.com/p/musicg/

私もこの API についてよく知りませんが、FFT データは FrequencyTimeDomainRepresentation オブジェクトに格納されていると思います。インターネットで検索したところ、ウィンドウを使用してデータを比較する必要があることがわかりましたが、その方法がわかりません。データの比較方法がわかりません。

FFT データを比較する方法と、保存されたファイル データを入力ストリーム データ (つまりコード) と一致させる方法を教えてください。その間、AndroidではなくJavaを使用して2つのオーディオファイルを比較しようとしています。

助けていただければ幸いです、ありがとう。

4

1 に答える 1

0

コメントで述べたように、これは dsp 関連の質問です。詳細については、dspexchange でお尋ねください。

しかし、あなたに素早い答えを与えるために。アルゴリズムが何をすべきかを正確に定義します。音声認識を行うべきですか?類似性を簡単に測定したい場合は、相互相関を使用します(Googleに問い合わせてください)。そのためにFFTも必要ありません(最近、FFTは多用されているようです。彼が何をしているのかわからない人は、FFTのものを考え出します)。FFT は、自分が何をしたいのかを理解し、本当にそれが必要であることがわかったら、機能する可能性があります。おそらく、いくつかの精神音響モデルを適用するためです。しかし、その場合でも、特にモバイル デバイスでは、単純な haar 変換で十分、単純かつ高速になる可能性があります。

于 2012-04-10T12:46:04.997 に答える