0

数フレームごとにマイクからデータを読み取り、そのピッチを推定する XNA スクリプトに取り組んでいます。このページ ( http://msdn.microsoft.com/en-us/library/ff827802.aspx )にほぼ正確に基づいて入力を行いました。

これで、バッファがいっぱいになりました。それは何を表していますか?すべてをリセットし、10 フレームごとにバッファーを確認したため、さまざまな時点で 1764 バイトのインスタンスが 9 つある巨大な配列のように見えます (全体は 15876 バイトの大きさです)。マイク入力の形式に関する情報が見つからないため、音圧の時間領域であると想定しています。これがどのように機能するか知っている人はいますか?FFT を稼働させている友人がいますが、プラグインを試みる前に、私が収集しているそのデータについてできる限り多くのことを学ぼうとしています。

4

1 に答える 1

0

サンプルはリトルエンディアン 16 ビット リニア PCM です。次のように、バイトの各ペアを符号付き短整数型に変換します。

short sample = (short)(buffer[i] | buffer[i+1] << 8);
于 2017-06-28T03:49:45.007 に答える