マイク入力からの周波数スペクトルをリアルタイムで分析および表示するスペクトログラム プログラム (python) を作成しようとしています。ここから音声を録音するためのテンプレート プログラムを使用しています: http://people.csail.mit.edu/hubert/pyaudio/#examples (録音例)
このテンプレート プログラムは問題なく動作しますが、行から返されるデータの形式がわかりませんdata = stream.read(CHUNK)
。このプログラムで使用されている .wav 形式について調査しましたが、.wav ファイル内のメタデータの定義だけで、実際のデータ バイト自体の意味を見つけることができません。
このプログラムは 16 ビットのサンプルを使用し、「チャンク」は Python 文字列に格納されていることを理解しています。各サンプルのデータが何を表しているかを正確に理解するのを誰かが助けてくれることを望んでいました. この情報のソースへのリンクだけでも役に立ちます。グーグルで調べてみましたが、正確に検索できるほど用語をよく知っているとは思いません。