2

EchoNest アナライザーのドキュメントには、音色に関して次のように記載されています。

音色さまざまな種類の楽器または声を区別する音符または音の品質です。これは、音の色、質感、または音質とも呼ばれる複雑な概念であり、ピッチやラウドネスとは関係なく、セグメントの時間空間面の形状から導き出されます。Echo Nest Analyzer の音色機能は、ほぼ 0 を中心とする 12 個の制限のない値を含むベクトルです。これらの値は、スペクトル サーフェスの高レベルの抽象化であり、重要度の順に並べられています。ただし、完全を期すために、最初の次元はセグメントの平均ラウドネスを表します。2番目は明るさを強調します。3 つ目は、音の平坦性とより密接に相関しています。4番目にアタックの強い音。など。12 の基底関数 (つまり、テンプレート セグメント) を表す下の画像を参照してください。セグメントの実際の音色は、係数値で重み付けされたこれらの 12 の基底関数の線形結合として最もよく説明されます。 b1 から b12 は、以下に示す 12 の基底関数です。音色ベクトルは、互いに比較して使用するのが最適です。 ここに画像の説明を入力

私の理解では、bベクトル ( ) は API のメソッド{b1...b12}によって返されるものです。getTimbreしかし、{c1...c12}係数はどこから来ているのでしょうか? ベクトル音色からスカラー音色を取得する方法がわかりません (主に分析 API がクローズド ソースであるため)。これで私を助けてもらえますか?

4

1 に答える 1