0

「正規化」とは、「最大音量が最大ヘッドルームに達するように全体の音量を増減する」ことを意味します。

私は学校のニュースクルーの一員であり、教師はコマーシャルを送りますが、コマーシャルは大きすぎたり小さすぎたりすることがよくあります。オーディオを正規化するプログラムを作成したい(圧縮や制限なし)。通常、.movファイルと.wmvファイルを処理する必要があります。誰かが私をいくつかの良いチュートリアルやライブラリなどに導くことができますか?

4

1 に答える 1

2

AVコンテナからオーディオストリームを逆多重化し、解凍します。ffmpegライブラリのラッパーが必要になります。たとえば、pyffmpeg、AVbin、pymediaを試してください。

正規化:サンプルごとの整数のNumpy配列を使用し、最大値を見つけてから、配列を乗算してボリュームを増幅/減衰します。ReplayGainの使用を検討してください。

オーディオを再圧縮し、元のビデオストリームを使用して新しいコンテナに再多重化します。上記と同じライブラリですが、特に独自のコンテナやコーデックの場合、問題が発生する可能性が高くなります。(たとえば、ffmpegは本当に古いWMAバージョンしか生成できないと思います。)

簡単なことではなく、既製のアプリを使用する場合と比較して、必ずしもそれだけの価値があるかどうかはわかりません。たとえば、ffmpeg自体には、スクリプトをバッチ処理できるコマンドラインがあります。たとえば、avidemuxには、コマンドラインインターフェイスとGUIインターフェイスの両方があります。

また、単純なピークの正規化では、有効な音量レベルを同じにするという点ではそれほど遠くないことがわかると思います。通常、ある程度のダイナミックレンジ圧縮も使用する必要があります。

于 2012-05-05T20:11:44.680 に答える