3

オーディオ ボリュームの正規化については既に質問しました。ほとんどのメソッド (たとえば、私が最も興味を持っているReplayGain ) では、PCM 制限を超えるピークが得られる可能性があります (ここでも読むことができます)。

単純なクリッピングは、おそらく私ができる最悪のことです。ウィキペディアが示唆しているように、何らかの形でダイナミック レンジ圧縮を行う必要があります。

個々の PCM サンプル値に適用する関数について話しています。別の同様の質問では、これを行うだけでは不十分であるか、私がすべきことではないという回答が 1 つあります。ただし、クリッピング ケースを処理する必要があるため、それはよくわかりません。答えは、一度に複数のサンプルで範囲圧縮を行い、すべてのサンプルに加えて単純なハードクリッピングを行うことを示唆していますか?

それはさておき、ウィキペディアの記事で説明されている関数は、私が望んでいるものとは少し違うようです (多くの場合、最終的にはまだクリッピング ケースがあります)。tanhのようなものを使用することを考えています。それは悪い考えですか?ボリュームはわずかに減少しますが、クリッピングが発生しないことが保証されます。

私のアプリケーションは一般的な音楽プレーヤーです。私は常にそれをオンにすることができ、ユーザーがこれをオフにしたくない可能性が非常に高いように、ほとんどすべての人に最適なソリューションを探しています。

4

2 に答える 2

3

瞬間的なダイナミック レンジ処理 (クリッピングや tanh 非直線性など) を使用すると、可聴歪みが発生します。正弦波を瞬時非線形関数に入れると、もはや正弦波はありません。特定のオーディオ アプリケーションには便利ですが、これらのアーティファクトは必要ないように思えます。

正規化は、波形のダイナミクス (最小/最大比に関して) には影響しません。正規化には、サンプルが最大値を超えないようにするために、波形を要素ごとに一定のスカラー値で乗算することが含まれます。処理前に信号全体を分析する必要があるため、このプロセスはオフラインでのみ実行できます。波形に激しいトランジェントが含まれている場合も、正規化はお勧めできません。信号全体は、一時的なピーク値をクリッピングしきい値で割った比率で減衰されます。

出力をクリッピングから保護したいだけなら、サイドチェーンタイプのコンプレッサーを使用するのが最善です。これの特定の形式がリミッターです (ゼロのアタック時間でしきい値を超える無限の圧縮率)。サイドチェーン コンプレッサーは、信号の平滑化されたエネルギー エンベロープを計算し、その関数に従ってさまざまなゲインを適用します。それらは瞬間的ではないため、言及した機能から得られる可聴歪みを減らします。リミッターはクリッピングを防ぐために瞬間的なアタックを持つことができますが、リミッターが後続の波形ピークに対して減衰したままになるようにリリース時間を許可し、後続の波形はちょうど下げられるため、歪みはありません. 強烈なサウンドの後、リミッターが回復します。

波形に強度の高いピークがたくさんある場合は、このような処理によってポンピング タイプのサウンドを得ることができます。これが問題になる場合は、次のレベルに進み、サブバンド内でダイナミクス処理を行うことができます。このようにして、周波数スペクトルの問題のある部分のみが減衰され、残りのサウンドは影響を受けません。

于 2012-09-30T23:14:29.670 に答える
2

一般的な解決策は、ゲインを追加する必要がある曲がほとんどないように、1 を大幅に下回るゲイン レベルにノーマライズすることです。つまり、ほとんどの場合、信号の音量を上げるのではなく下げることになります。さまざまなスタイルのさまざまな曲を試して、このレベルを把握してください。

時折、十分なゲインが必要な曲に出くわすことがありますが、ある時点でクリップしてしまいます。選択肢は 2 つあります。 1. ゲインをあまり上げない。この1曲は少し静かに聞こえます。C'est la vie. (これは一般的なアプローチです)、または 2. 少量のダイナミック レンジの圧縮および/または制限を適用します。もちろん、1 と 2 の組み合わせも可能です。iTunes は 1 と 2 の組み合わせを使用していると思いますが、2 番目の作業には非常に力を入れており、ほとんど適用されません。

サンプルごとに tanh のような関数を使用すると、可聴歪みが発生します。一般的な音楽プレーヤーでこれを行う必要はありません。これは、ギター アンプ シミュレーターを「ダーティ」で「汚れた」サウンドにするために行われていることです。ロック、ポップス、またはすでに歪みの多いその他の現代音楽では聞こえないかもしれませんが、注意深く録音された合唱、ジャズ、またはバイオリンのソロ音楽では、人々は動揺します. これは tanh の選択とは関係ありません。ちなみに、非線形関数は歪みを生成します。

ダイナミック レンジ圧縮は、時間の経過とともに信号に適用されるエンベロープを使用します。http://en.wikipedia.org/wiki/Dynamic_range_compression これを正しく行うのは難しく、真に「透過的」なコンプレッサーを作成することはできません。リミッターは、(少なくとも理論上は) 信号が特定のレベルを超えるのを防ぐコンプレッサーの極端なバージョンと考えることができます。デジタル「先読み」リミッターは、クリッピングを目立たなくすることができます。慎重に使用すると、かなり透明になります。

このアプローチを採用する場合は、この機能をオフにできることを確認してください。どんなに透明だと思っていても、誰かがそれを聞いて気に入らないからです。

于 2012-10-01T01:52:13.560 に答える