私はmp3ファイルから音楽を分析しようとしています。テンポやピッチなどの音楽的特徴について知りたい。このデータを取得するにはどうすればよいですか?この情報、さらにはライブラリを提供してくれるオープンソースソフトウェアはありますか?
誰かが私に何をすべきか、どこから探し始めるかについてのヒントを教えてもらえますか?ありがとう。
私はmp3ファイルから音楽を分析しようとしています。テンポやピッチなどの音楽的特徴について知りたい。このデータを取得するにはどうすればよいですか?この情報、さらにはライブラリを提供してくれるオープンソースソフトウェアはありますか?
誰かが私に何をすべきか、どこから探し始めるかについてのヒントを教えてもらえますか?ありがとう。
LibMADは、非常にうまく機能するオープンソースの mp3 デコーダー ライブラリです。これにより、変更する「生」データが取得されます。ピッチやその他の「特徴」を得るには、数学に飛び込む必要があります。
ピッチは基本的に音の周波数です。これは、FFT を使用して「オンザフライ」で (実際にはデータのブロック単位で) 実行できます。Python numpyには fft 関数があります (生データがある場合)。c++ の fft のライブラリは、こちらにあります。
FFTの背後にあるいくつかの「数学」はここにあります
テンポは、生データに 2 次ローパス フィルターを適用してからデータを FFT することによっても計算できます。デジタル フィルターについては、上記にリンクされている dspguide でも説明されています。
頑張ってください。いくつかの良いことですが、準備ができていない場合は多くの数学があります.
大胆さが役立ちます。プログラムからそれらを使用したい場合は、それらのソース コードをチェックアウトできます。http://audacity.sourceforge.net/download/source
注: まず、audacity をダウンロードして、必要なものがすべて揃っているかどうかを確認してください。
どこから始めればよいかわからない場合は、すでにアルゴリズムが組み込まれているサウンドフォージまたはその他のプロの編集プログラムを購入することをお勧めします。あなたが本当に決心しているなら、物理学の本を手に入れてください。音の全体的なピッチを見つけることは微積分変換です。テンポなどのサウンドに関するその他の情報は、インパルス応答フィルターといくつかの AI の助けを借りて見つけることができます。本当に専念している場合を除き、エディターを購入してください。
更新: 本当にやりたい場合は、ここに素晴らしいリソースがあります。
ChucK 音楽プログラミング言語の単位アナライザーを考えてみましょう: http://chuck.cs.princeton.edu/doc/examples/#uana