python - 入力オーディオストリームから周波数情報を抽出する方法 (PortAudio を使用)?

Question

PortAudio(PyAudio)を使って音(声)を録音し、対応する音波を画面に出力したい。絶望的ですが、オーディオストリームから周波数情報を抽出して、Hz/時間形式で描画することができません。

録音した音声を 5 秒間録音して再生するコードスニペットの例を次に示します。

p = pyaudio.PyAudio()

chunk = 1024
seconds = 5

stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=44100,
                input=True,
                output=True)

for i in range(0, 44100 / chunk * seconds):
    data = stream.read(chunk)
    stream.write(data, chunk)

上記の変数「データ」から必要な情報を抽出したいと思います。(または、PortAudio または Python バインディングを備えた別のライブラリを使用して、他の高レベルのアプローチを使用します。)

どんな助けにもとても感謝しています！漠然と関連するオーディオ分析の知恵のヒントでさえ、高く評価されます。:)

score 4 · Accepted Answer

あなたが望むのは、おそらく音声データのフーリエ変換です。それを計算できるパッケージがいくつかあります。scipyそしてnumpyそのうちの2人です。「高速フーリエ変換」(FFT) と呼ばれることがよくありますが、それはアルゴリズムの名前にすぎません。

以下はその使用例です: https://svn.enthought.com/enthought/browser/Chaco/trunk/examples/advanced/spectrum.py

score 1 · Accepted Answer

分析を周波数領域と時間領域の両方で実行する場合、フーリエ変換はあまり役に立ちません。「ウェーブレット変換」を見たいと思うかもしれません。pywavelets と呼ばれるパッケージがあります... http://www.pybytes.com/pywavelets/#discrete-wavelet-transform-dwt

python - 入力オーディオストリームから周波数情報を抽出する方法 (PortAudio を使用)?

2 に答える 2

Related

Reference