5

プログラミングと変換に少し問題があります。楽器で演奏された音符を認識する AI を設計しており、wave ファイルから生のサウンド データを抽出する必要があります。私の目的は、AI で使用するために、ファイル内の時間のチャンクに対して FFT 操作を実行することです。このためには、オーディオ ファイルの振幅リストが必要ですが、機能する変換手法が見つからないようです。ファイルは MP3 として始まり、次にそれらを wav ファイルに変換しますが、読み込もうとすると意味不明な内容を吐き出す圧縮ファイルになってしまいます。wavファイルをPythonのwaveモジュールと互換性のあるもの、またはデータを振幅リストに直接変換するものに変換する方法を知っている人はいますか?

4

2 に答える 2

3

デフォルトの Python ウェーブ モジュールは完全ではありません。代わりに scipy に含まれているものを試すこともできます。

チェックアウト: Python での *.wav ファイルの読み取り

オーディオで数値的な重労働を行う場合は、とにかく scipy が最適なオプションになる可能性があります。

于 2011-02-03T21:02:22.293 に答える
2

Python は .dat ファイルを読み取ることができると思います。SoX を使用して、mp3 や wav などを、単に「時間 - 左アンプ - 右アンプ」のテキスト リストである .dat ファイルに変換できます。

コードは単純に sox soundfile.mp3 soundfile.dat です。

http://sox.sourceforge.net/

Sox はコマンド ラインです。Mac のターミナルで実行しますが、使用している CPU に応じて、Bash または Linux コマンドを理解できるものはすべて動作するはずです。

それが役立つことを願っています!

Pure Data も参照してください。直感的なグラフィカル プログラミング言語に組み込まれた優れた FFT 変換が含まれています。

于 2011-08-22T22:04:53.120 に答える